해운항만물류산업은 세계 경제활동과 밀접한 관계를 가지고 있으며, 특히 무역의존도가 높은 우리나라의 항만 시설은 중요한 사회간접자본시설이다. 부산항은 우리나라 최대의 항만으로 우리나라 컨테이너 운송의 75%가 부산항을 통해 운송되고 있으며, 국가 경쟁력 측면에서 그 중요성은 매우 크다. 항만 물동량 예측은 항만 개발 및 운영 전략에 영향을 미치며, 정확도 높은 컨테이너 물동량 예측은 필수적이다. 하지만 오늘날 해운항만물류산업 환경의 급격한 변화로 인해 기존 시계열 예측 방법으로는 예측 정확도 향상에 어려움이 있다. 본 연구에서는 부산항 컨테이너 물동량 예측 정확도 향상을 위해 딥러닝 모형 중 LSTM 모형을 활용하여 컨테이너 물동량을 예측한다. 모형의 성능 평가를 위해서 SARIMA 모형과 LSTM 모형의 예측 정확도를 비교한다. 그 결과 LSTM 모형이 SARIMA 모형보다 예측 정확도가 높게 나타났으며, 예측치가 실측치의 특성을 반영하여 잘 나타나고 있음을 확인하였다.
해운항만물류산업은 세계 경제활동과 밀접한 관계를 가지고 있으며, 특히 무역의존도가 높은 우리나라의 항만 시설은 중요한 사회간접자본시설이다. 부산항은 우리나라 최대의 항만으로 우리나라 컨테이너 운송의 75%가 부산항을 통해 운송되고 있으며, 국가 경쟁력 측면에서 그 중요성은 매우 크다. 항만 물동량 예측은 항만 개발 및 운영 전략에 영향을 미치며, 정확도 높은 컨테이너 물동량 예측은 필수적이다. 하지만 오늘날 해운항만물류산업 환경의 급격한 변화로 인해 기존 시계열 예측 방법으로는 예측 정확도 향상에 어려움이 있다. 본 연구에서는 부산항 컨테이너 물동량 예측 정확도 향상을 위해 딥러닝 모형 중 LSTM 모형을 활용하여 컨테이너 물동량을 예측한다. 모형의 성능 평가를 위해서 SARIMA 모형과 LSTM 모형의 예측 정확도를 비교한다. 그 결과 LSTM 모형이 SARIMA 모형보다 예측 정확도가 높게 나타났으며, 예측치가 실측치의 특성을 반영하여 잘 나타나고 있음을 확인하였다.
The maritime and port logistics industry is closely related to global trade and economic activity, especially for Korea, which is highly dependent on trade. As the largest port in Korea, Busan Port processes 75% of the country's container cargo; the port is therefore extremely important in terms of ...
The maritime and port logistics industry is closely related to global trade and economic activity, especially for Korea, which is highly dependent on trade. As the largest port in Korea, Busan Port processes 75% of the country's container cargo; the port is therefore extremely important in terms of the country's national competitiveness. Port container cargo volume forecasts influence port development and operation strategies, and therefore require a high level of accuracy. However, due to unexpected and sudden changes in the port and maritime transportation industry, it is difficult to increase the accuracy of container volume forecasting using existing time series models. Among deep learning models, this study uses the LSTM model to enhance the accuracy of container cargo volume forecasting for Busan Port. To evaluate the model's performance, the forecasting accuracies of the SARIMA and LSTM models are compared. The findings reveal that the forecasting accuracy of the LSTM model is higher than that of the SARIMA model, confirming that the forecasted figures fully reflect the actual measurement figures.
The maritime and port logistics industry is closely related to global trade and economic activity, especially for Korea, which is highly dependent on trade. As the largest port in Korea, Busan Port processes 75% of the country's container cargo; the port is therefore extremely important in terms of the country's national competitiveness. Port container cargo volume forecasts influence port development and operation strategies, and therefore require a high level of accuracy. However, due to unexpected and sudden changes in the port and maritime transportation industry, it is difficult to increase the accuracy of container volume forecasting using existing time series models. Among deep learning models, this study uses the LSTM model to enhance the accuracy of container cargo volume forecasting for Busan Port. To evaluate the model's performance, the forecasting accuracies of the SARIMA and LSTM models are compared. The findings reveal that the forecasting accuracy of the LSTM model is higher than that of the SARIMA model, confirming that the forecasted figures fully reflect the actual measurement figures.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 연구에서는 글로벌 허브 항만인 부산항의 경쟁력 향상을 위해 2004년부터 2018년까지의 월별 부산항 컨테이너 물동량 자료를 활용하여 부산항 컨테이너 물동량을 예측한다. 컨테이너 물동량 예측을 위해 많은 연구들이 이루어졌지만, 해운 항만물류산업의 급격한 변화로 인해 컨테이너 물동량 흐름의 변동성과 복잡성이 증가하여 기존 시계열 예측 방법으로는 예측 정확도 향상에 어려움이 있다.
본 연구에서는 딥러닝 기법 중 LSTM 모형을 활용하여 컨테이너 물동량 예측을 시도하였으며, 이는 딥러닝을 활용한 컨테이너 물동량 예측 및 분석과 관련된 기초연구로 활용될 수 있는 점에서 의의를 지닌다고 할 수 있다. 또한 정확도 높은 예측치를 바탕으로 해운항만물류산업 및 항만 운영 이해관계자들에게 항만 개발 및 시설 확장을 위한 투자 의사 결정도구로 활용될 수 있으며, 터미널 운영 및 장비 활용 계획, 컨테이너 물동량 유치를 위한 마케팅 계획과 같은 항만 운영 전략 수립에 참고가 될 수 있을 것이다.
본 연구에서는 최적의 하이퍼파라미터를 찾기 위해 과 같이 하이퍼파라미터 입력 값에 대해서 반복적으로 실험을 진행하였다.
대표적인 시계열 예측 모형인 ARIMA 모형은 계절 변동이나 추세가 잘 반영되어 있고, 시계열 자료의 패턴이 반복되어 나타나는 경우에는 예측 정확도가 높게 나타나지만, 불규칙하고 변동성이 큰 경우에는 예측력이 떨어지고 오차가 발생하게 된다. 이러한 점에 착안하여 본 연구에서는 컨테이너 물동량 예측 정확도 향상을 위해 비선형 모델링 (non-linear modeling)이 가능한 딥러닝(Deep Learning) 모형 중 LSTM(Long Short-Term Memory) 모형을 활용하여 컨테이너 물동량을 예측 한다. 모형의 성능 평가를 위해서 SARIMA(Seasonal ARIMA) 모형과 LSTM 모형의 예측 정확도를 비교하여 모형의 객관적인 성능을 검증한다.
이에 본 연구에서는 컨테이너 물동량 흐름의 변동성과 복잡성이 증가하는 상황에서의 컨테이너 물동량 예측 정확도 향상을 위해서 딥러닝 기법 중 LSTM 모형을 활용한 컨테이너 물동량 예측 모형을 개발ㆍ제안하였다.
제안 방법
LSTM 모형의 성능 평가 위해 LSTM 모형과 SARIMA 모형의 예측치를 과 같이 MAPE, RMSE 값을 비교하였다.
전체 물동량 자료의 80%인 2004년부터 2015년까지의 물동량 자료를 Train data로 사용하고 나머지 20%인 2016년부터 2018년까지의 물동량 자료를 Test data로 사용하였다. 그리고 예측 정확도 검증을 위해 도출된 예측 물동량과 실제 물동량의 차이를 비교한다.
이러한 점에 착안하여 본 연구에서는 컨테이너 물동량 예측 정확도 향상을 위해 비선형 모델링 (non-linear modeling)이 가능한 딥러닝(Deep Learning) 모형 중 LSTM(Long Short-Term Memory) 모형을 활용하여 컨테이너 물동량을 예측 한다. 모형의 성능 평가를 위해서 SARIMA(Seasonal ARIMA) 모형과 LSTM 모형의 예측 정확도를 비교하여 모형의 객관적인 성능을 검증한다.
부산항 월별 컨테이너 물동량 자료를 사용하여 학습을 진행하였으며, 모형의 최적화 과정에서 안정성 및 수렴 속도를 향상시키기 위해서 0과 1사이의 값으로 정규화(normalization)하여 진행하였다.
LSTM 모형의 성능 평가 위해 LSTM 모형과 SARIMA 모형의 예측치를 <표 2>과 같이 MAPE, RMSE 값을 비교하였다. 시계열 자료의 전처리 과정에서 Log 변환 및 0과 1사이의 값으로 정규화한 값을 다시 원래 시계열 자료 단위인 컨테이너 TEU 단위로 변환하여 예측 오차율을 계산하였다.
예측 모형의 성능 검증을 위해서 2016년부터 2018년까지의 예측치와 실측치를 비교하였다. 대표적인 예측 정확도 검증 방법인 평균제곱근오차 (RMSE: Root Mean Squared Error)와 절대평균오차 비율(MAPE: Mean Absolute Percentage Error)를 이용하였다.
매 epoch마다 train set과 test set의 손실율(loss rate)을 측정하여 <그림 4>와 같이 학습이 잘 이루어지는 하이퍼파라미터를 선정하였다. 최종적으로 선정된 하이퍼파라미터는 Neuron 4, Hidden Layer 1, Batch Size 1, Epoch 40, Dropout 0.2, Activate Function은 tanh function으로 선정되었다.
대상 데이터
매 epoch마다 train set과 test set의 손실율(loss rate)을 측정하여 와 같이 학습이 잘 이루어지는 하이퍼파라미터를 선정하였다.
본 연구에서 사용한 자료는 부산항만공사 해운항 만물류 빅데이터 분석시스템의 2004년 1월 ~ 2018 년 12월 부산항 월별 컨테이너 물동량 자료를 사용하였다. <그림 1>과 같이 전체 물동량 데이터의 Train set과 Test set으로 분리하였다.
전체 물동량 자료의 80%인 2004년부터 2015년까지의 물동량 자료를 Train data로 사용하고 나머지 20%인 2016년부터 2018년까지의 물동량 자료를 Test data로 사용하였다. 그리고 예측 정확도 검증을 위해 도출된 예측 물동량과 실제 물동량의 차이를 비교한다.
데이터처리
예측 모형의 성능 검증을 위해서 2016년부터 2018년까지의 예측치와 실측치를 비교하였다. 대표적인 예측 정확도 검증 방법인 평균제곱근오차 (RMSE: Root Mean Squared Error)와 절대평균오차 비율(MAPE: Mean Absolute Percentage Error)를 이용하였다.
또한 예측 모형의 객관적인 검증을 위해서 예측치와 실측치와 비교하고 SARIMA 모형, LSTM 모형의 예측 정확도를 비교하였다. 예측 분석 결과 LSTM 모형이 SARIMA 모형보다 예측 정확도가 높게 나타났으며, 예측치가 실측치의 특성을 반영하여 잘 나타나고 있음을 확인하였다.
이론/모형
본 연구에서 분석을 위해 사용한 LSTM 모형은 Python 3.6.8, Tensorflow 1.13.1 기반의 Keras library를 사용하였으며, SARIMA 모형은 R의 Forecast library를 사용하였다.
본 연구에서는 SARIMA 모형을 이용한 부산항 컨테이너 물동량 예측에 관한 선행연구를 참고하여 모형을 식별하였다. 이재득(2013)의 연구에서는 1992년부터 2011년까지의 부산항 월별 컨테이너 물동량 자료를 바탕으로 SARIMA 모형을 활용하여 부산항 컨테이너 물동량을 예측하였으며, 10가지 SARIMA 모형을 추정하고 적합한 모형을 식별하였다.
성능/효과
LSTM 모형과 SARIMA 모형의 예측 오차율은 각각 2.05%, 3.38%로 두 모형의 예측 오차율 차이는 1.33%로 LSTM 모형의 예측 정확도가 더 높게 나타났다. 또한 비교 그래프에서도 보듯이 LSTM 모형의 예측치가 실측치의 특성을 반영하여 잘 나타내고 있다.
(2010)은 대만 내주요 항만들의 월별 물동량 자료를 사용하여 유전자 알고리즘, 분해분석법, SARIMA 모형을 활용하여 물동량 예측치를 도출하였다. 도출된 예측치를 실측치와 비교한 결과 유전자 알고리즘의 예측력이 가장 우수하게 나타났다.
선행연구를 바탕으로 조합 가능한 여러 가지 모형 중에서 AIC(Akaike Information Criteria) 값이 가장 작은 모형 선택하였으며, 최종적으로 ARIMA(2,1,0)×(2,1,0) 12 로 식별되었다.
또한 예측 모형의 객관적인 검증을 위해서 예측치와 실측치와 비교하고 SARIMA 모형, LSTM 모형의 예측 정확도를 비교하였다. 예측 분석 결과 LSTM 모형이 SARIMA 모형보다 예측 정확도가 높게 나타났으며, 예측치가 실측치의 특성을 반영하여 잘 나타나고 있음을 확인하였다.
후속연구
본 연구에서는 딥러닝 기법 중 LSTM 모형을 활용하여 컨테이너 물동량 예측을 시도하였으며, 이는 딥러닝을 활용한 컨테이너 물동량 예측 및 분석과 관련된 기초연구로 활용될 수 있는 점에서 의의를 지닌다고 할 수 있다. 또한 정확도 높은 예측치를 바탕으로 해운항만물류산업 및 항만 운영 이해관계자들에게 항만 개발 및 시설 확장을 위한 투자 의사 결정도구로 활용될 수 있으며, 터미널 운영 및 장비 활용 계획, 컨테이너 물동량 유치를 위한 마케팅 계획과 같은 항만 운영 전략 수립에 참고가 될 수 있을 것이다.
한계점 및 향후 연구 방향으로는 컨테이너 물동량에 영향을 미치는 외생변수를 포함한 다변량 딥러닝 시계열 모형의 컨테이너 물동량 예측이 필요하다. 컨테이너 물동량은 국내외 경제 상황에 영향을 많이 받기 때문에 GDP, 환율, 경기지수 등과 같은 경제지표를 포함한 컨테이너 물동량 예측이 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
항만 물동량 예측이란?
항만 물동량 예측은 항만 경쟁력 향상을 위한 중요한 요소이며, 항만 물동량 자료에 기초하여 시설 투자계획, 항만운영계획 등이 수립된다. 많은 선행 연구에서 ARIMA(Autoregressive integrated moving average) 모형, 인과모형, 회귀분석 등의 다양한 시계열 예측 모형을 활용하여 항만 물동량을 예측하였다.
시계열 예측 모형을 활용하여 항만 물동량을 예측할 경우의 문제점은?
많은 선행 연구에서 ARIMA(Autoregressive integrated moving average) 모형, 인과모형, 회귀분석 등의 다양한 시계열 예측 모형을 활용하여 항만 물동량을 예측하였다. 하지만 글로벌 금융위기 이후 항만 물동량 흐름의 변동성과 복잡성이 증가하였다. 또한 선박의 대형화, 기항지의 축소와 같은 해운항만물류산업의 급격한 변화로 인해 기존 시계열 예측 방법으로는 예측 정확도 향상에 어려움이 있다(Xie, et al., 2015).
항만 경쟁력을 높이기 위해 요구되는 것은?
또한 시설 확보가 시의적절하게 이루어지지 않는다면 물류비 상승, 수출입 경쟁력 약화, 사회적 손실 발생 등으로 항만 경쟁력이 하락한다(김범 중, 2010). 항만 경쟁력을 높이기 위해서는 항만의 면적 대형화를 통해 취항 선사 수를 증가시키기 위한 항만의 관리 운영이 요구되며(신계선, 2007), 항만에 입항하는 선박이 신속하게 하역작업을 완료 하고 출항할 수 있도록 선박의 체선 시간을 줄이는 것이 항만 경쟁력의 중요한 요소로 이를 위해서는 항만 시설의 적절한 확장이 필요하다(이민규, 2012).
참고문헌 (27)
고병욱.윤희성.김은수.최건우(2018), 컨테이너 해상물동량 예측 모형 연구, KMI.
김범중(2010), 항만시설 확보의 중요성에 대하여, 해양물류연구, 제7권, 5-14.
김정훈(2008), 시계열 모형을 이용한 부산 북항의 물동량 예측, 한국항만경제학회지, 제24권 제2호, 1-17.
Brooks, M., Pallis, T. and Perkins, S.(2014), Port investment and container shipping markets, International Transport Forum Discussion Papers(OECD), No. 2014/03.
Chen, S. H. and Chen, J. N.(2010), Forecasting Container Throughputs at Ports Using Genetic Programming, Expert Systems with Applications, 37(3), 2054-2058.
Chung, J., Gulcehre, C., Cho, K. and Bengio, Y.(2014), Empirical evaluation of gated recurrent neural networks on sequence modeling, arXiv preprint arXiv:1412.3555.
Ding, M. J., Zhang, S. Z., Zhong, H. D., Wu, Y. H. and Zhang, L. B.(2019). A Prediction Model of the Sum of Container Based on Combined BP Neural Network and SVM, Journal of Information Processing Systems, 15(2), 305-319.
Fang F. P. and Fang X. F.(2013), Multivariant forecasting mode of Guangdong province port throughput with genetic algorithms and Back Propagation neural network, Procedia-Social and Behavioral Sciences, 96, 1165-1174.
LeCun, Y., Boser, B., Denker, J. S., Henderson, D., Howard, R. E., Hubbard, W. and Jackel, L. D.(1989), Backpropagation applied to handwritten zip code recognition, Neural computation, 1(4), 541-551.
LeCun, Y., Bottou, L., Bengio, Y. and Haffner, P.(1998), Gradient-based learning applied to document recognition, Proceedings of the IEEE, 86(11), 2278-2324.
Meersman, H., Van de Voorde, E. and Vanelslander, T.(2003), Port pricing. Considerations on economic principles and marginal costs, European Journal of Transport and Infrastructure Research, 3(4), 371-386.
Raschka, S.(2018), Model evaluation, model selection, and algorithm selection in machine learning, arXiv preprint arXiv:1811.12808.
Reimers, N. and Gurevych, I.(2017), Optimal hyperparameters for deep lstm-networks for sequence labeling tasks, arXiv preprint arXiv:1707.06799.
Xie, G., Wang, S., Zhao, Y. and Lai, K. K.(2013), Hybrid approaches based on LSSVR model for container throughput forecasting: a comparative study, Applied Soft Computing, 13(5), 2232-2241.
Zhang, C., Huang, L. and Zhao, Z.(2013), Research on combination forecast of port cargo throughput based on time series and causality analysis, Journal of Industrial Engineering and Management, 6(1), 124-134.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.