[논문]LSTM을 활용한 부산항 컨테이너 물동량 예측

김두환; 이강배

doi:10.38121/kpea.2020.06.36.2.53

LSTM을 활용한 부산항 컨테이너 물동량 예측
Forecasting the Container Volumes of Busan Port using LSTM 원문보기

한국항만경제학회지 = Journal of Korea Port Economic Association, v.36 no.2, 2020년, pp.53 - 62

김두환 (동아대학교 스마트물류연구센터) , 이강배 (동아대학교 경영정보학과)

초록
AI-Helper

해운항만물류산업은 세계 경제활동과 밀접한 관계를 가지고 있으며, 특히 무역의존도가 높은 우리나라의 항만 시설은 중요한 사회간접자본시설이다. 부산항은 우리나라 최대의 항만으로 우리나라 컨테이너 운송의 75%가 부산항을 통해 운송되고 있으며, 국가 경쟁력 측면에서 그 중요성은 매우 크다. 항만 물동량 예측은 항만 개발 및 운영 전략에 영향을 미치며, 정확도 높은 컨테이너 물동량 예측은 필수적이다. 하지만 오늘날 해운항만물류산업 환경의 급격한 변화로 인해 기존 시계열 예측 방법으로는 예측 정확도 향상에 어려움이 있다. 본 연구에서는 부산항 컨테이너 물동량 예측 정확도 향상을 위해 딥러닝 모형 중 LSTM 모형을 활용하여 컨테이너 물동량을 예측한다. 모형의 성능 평가를 위해서 SARIMA 모형과 LSTM 모형의 예측 정확도를 비교한다. 그 결과 LSTM 모형이 SARIMA 모형보다 예측 정확도가 높게 나타났으며, 예측치가 실측치의 특성을 반영하여 잘 나타나고 있음을 확인하였다.

Abstract ▼ AI-Helper

The maritime and port logistics industry is closely related to global trade and economic activity, especially for Korea, which is highly dependent on trade. As the largest port in Korea, Busan Port processes 75% of the country's container cargo; the port is therefore extremely important in terms of the country's national competitiveness. Port container cargo volume forecasts influence port development and operation strategies, and therefore require a high level of accuracy. However, due to unexpected and sudden changes in the port and maritime transportation industry, it is difficult to increase the accuracy of container volume forecasting using existing time series models. Among deep learning models, this study uses the LSTM model to enhance the accuracy of container cargo volume forecasting for Busan Port. To evaluate the model's performance, the forecasting accuracies of the SARIMA and LSTM models are compared. The findings reveal that the forecasting accuracy of the LSTM model is higher than that of the SARIMA model, confirming that the forecasted figures fully reflect the actual measurement figures.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

따라서 본 연구에서는 글로벌 허브 항만인 부산항의 경쟁력 향상을 위해 2004년부터 2018년까지의 월별 부산항 컨테이너 물동량 자료를 활용하여 부산항 컨테이너 물동량을 예측한다. 컨테이너 물동량 예측을 위해 많은 연구들이 이루어졌지만, 해운 항만물류산업의 급격한 변화로 인해 컨테이너 물동량 흐름의 변동성과 복잡성이 증가하여 기존 시계열 예측 방법으로는 예측 정확도 향상에 어려움이 있다.
본 연구에서는 딥러닝 기법 중 LSTM 모형을 활용하여 컨테이너 물동량 예측을 시도하였으며, 이는 딥러닝을 활용한 컨테이너 물동량 예측 및 분석과 관련된 기초연구로 활용될 수 있는 점에서 의의를 지닌다고 할 수 있다. 또한 정확도 높은 예측치를 바탕으로 해운항만물류산업 및 항만 운영 이해관계자들에게 항만 개발 및 시설 확장을 위한 투자 의사 결정도구로 활용될 수 있으며, 터미널 운영 및 장비 활용 계획, 컨테이너 물동량 유치를 위한 마케팅 계획과 같은 항만 운영 전략 수립에 참고가 될 수 있을 것이다.
본 연구에서는 최적의 하이퍼파라미터를 찾기 위해 과 같이 하이퍼파라미터 입력 값에 대해서 반복적으로 실험을 진행하였다.
대표적인 시계열 예측 모형인 ARIMA 모형은 계절 변동이나 추세가 잘 반영되어 있고, 시계열 자료의 패턴이 반복되어 나타나는 경우에는 예측 정확도가 높게 나타나지만, 불규칙하고 변동성이 큰 경우에는 예측력이 떨어지고 오차가 발생하게 된다. 이러한 점에 착안하여 본 연구에서는 컨테이너 물동량 예측 정확도 향상을 위해 비선형 모델링 (non-linear modeling)이 가능한 딥러닝(Deep Learning) 모형 중 LSTM(Long Short-Term Memory) 모형을 활용하여 컨테이너 물동량을 예측 한다. 모형의 성능 평가를 위해서 SARIMA(Seasonal ARIMA) 모형과 LSTM 모형의 예측 정확도를 비교하여 모형의 객관적인 성능을 검증한다.
이에 본 연구에서는 컨테이너 물동량 흐름의 변동성과 복잡성이 증가하는 상황에서의 컨테이너 물동량 예측 정확도 향상을 위해서 딥러닝 기법 중 LSTM 모형을 활용한 컨테이너 물동량 예측 모형을 개발ㆍ제안하였다.

제안 방법

LSTM 모형의 성능 평가 위해 LSTM 모형과 SARIMA 모형의 예측치를 과 같이 MAPE, RMSE 값을 비교하였다.
전체 물동량 자료의 80%인 2004년부터 2015년까지의 물동량 자료를 Train data로 사용하고 나머지 20%인 2016년부터 2018년까지의 물동량 자료를 Test data로 사용하였다. 그리고 예측 정확도 검증을 위해 도출된 예측 물동량과 실제 물동량의 차이를 비교한다.
이러한 점에 착안하여 본 연구에서는 컨테이너 물동량 예측 정확도 향상을 위해 비선형 모델링 (non-linear modeling)이 가능한 딥러닝(Deep Learning) 모형 중 LSTM(Long Short-Term Memory) 모형을 활용하여 컨테이너 물동량을 예측 한다. 모형의 성능 평가를 위해서 SARIMA(Seasonal ARIMA) 모형과 LSTM 모형의 예측 정확도를 비교하여 모형의 객관적인 성능을 검증한다.
부산항 월별 컨테이너 물동량 자료를 사용하여 학습을 진행하였으며, 모형의 최적화 과정에서 안정성 및 수렴 속도를 향상시키기 위해서 0과 1사이의 값으로 정규화(normalization)하여 진행하였다.
LSTM 모형의 성능 평가 위해 LSTM 모형과 SARIMA 모형의 예측치를 <표 2>과 같이 MAPE, RMSE 값을 비교하였다. 시계열 자료의 전처리 과정에서 Log 변환 및 0과 1사이의 값으로 정규화한 값을 다시 원래 시계열 자료 단위인 컨테이너 TEU 단위로 변환하여 예측 오차율을 계산하였다.
예측 모형의 성능 검증을 위해서 2016년부터 2018년까지의 예측치와 실측치를 비교하였다. 대표적인 예측 정확도 검증 방법인 평균제곱근오차 (RMSE: Root Mean Squared Error)와 절대평균오차 비율(MAPE: Mean Absolute Percentage Error)를 이용하였다.
매 epoch마다 train set과 test set의 손실율(loss rate)을 측정하여 <그림 4>와 같이 학습이 잘 이루어지는 하이퍼파라미터를 선정하였다. 최종적으로 선정된 하이퍼파라미터는 Neuron 4, Hidden Layer 1, Batch Size 1, Epoch 40, Dropout 0.2, Activate Function은 tanh function으로 선정되었다.

대상 데이터

매 epoch마다 train set과 test set의 손실율(loss rate)을 측정하여 와 같이 학습이 잘 이루어지는 하이퍼파라미터를 선정하였다.
본 연구에서 사용한 자료는 부산항만공사 해운항 만물류 빅데이터 분석시스템의 2004년 1월 ~ 2018 년 12월 부산항 월별 컨테이너 물동량 자료를 사용하였다. <그림 1>과 같이 전체 물동량 데이터의 Train set과 Test set으로 분리하였다.
전체 물동량 자료의 80%인 2004년부터 2015년까지의 물동량 자료를 Train data로 사용하고 나머지 20%인 2016년부터 2018년까지의 물동량 자료를 Test data로 사용하였다. 그리고 예측 정확도 검증을 위해 도출된 예측 물동량과 실제 물동량의 차이를 비교한다.

데이터처리

예측 모형의 성능 검증을 위해서 2016년부터 2018년까지의 예측치와 실측치를 비교하였다. 대표적인 예측 정확도 검증 방법인 평균제곱근오차 (RMSE: Root Mean Squared Error)와 절대평균오차 비율(MAPE: Mean Absolute Percentage Error)를 이용하였다.
또한 예측 모형의 객관적인 검증을 위해서 예측치와 실측치와 비교하고 SARIMA 모형, LSTM 모형의 예측 정확도를 비교하였다. 예측 분석 결과 LSTM 모형이 SARIMA 모형보다 예측 정확도가 높게 나타났으며, 예측치가 실측치의 특성을 반영하여 잘 나타나고 있음을 확인하였다.

이론/모형

본 연구에서 분석을 위해 사용한 LSTM 모형은 Python 3.6.8, Tensorflow 1.13.1 기반의 Keras library를 사용하였으며, SARIMA 모형은 R의 Forecast library를 사용하였다.
본 연구에서는 SARIMA 모형을 이용한 부산항 컨테이너 물동량 예측에 관한 선행연구를 참고하여 모형을 식별하였다. 이재득(2013)의 연구에서는 1992년부터 2011년까지의 부산항 월별 컨테이너 물동량 자료를 바탕으로 SARIMA 모형을 활용하여 부산항 컨테이너 물동량을 예측하였으며, 10가지 SARIMA 모형을 추정하고 적합한 모형을 식별하였다.

성능/효과

LSTM 모형과 SARIMA 모형의 예측 오차율은 각각 2.05%, 3.38%로 두 모형의 예측 오차율 차이는 1.33%로 LSTM 모형의 예측 정확도가 더 높게 나타났다. 또한 비교 그래프에서도 보듯이 LSTM 모형의 예측치가 실측치의 특성을 반영하여 잘 나타내고 있다.
(2010)은 대만 내주요 항만들의 월별 물동량 자료를 사용하여 유전자 알고리즘, 분해분석법, SARIMA 모형을 활용하여 물동량 예측치를 도출하였다. 도출된 예측치를 실측치와 비교한 결과 유전자 알고리즘의 예측력이 가장 우수하게 나타났다.
선행연구를 바탕으로 조합 가능한 여러 가지 모형 중에서 AIC(Akaike Information Criteria) 값이 가장 작은 모형 선택하였으며, 최종적으로 ARIMA(2,1,0)×(2,1,0) 12 로 식별되었다.
또한 예측 모형의 객관적인 검증을 위해서 예측치와 실측치와 비교하고 SARIMA 모형, LSTM 모형의 예측 정확도를 비교하였다. 예측 분석 결과 LSTM 모형이 SARIMA 모형보다 예측 정확도가 높게 나타났으며, 예측치가 실측치의 특성을 반영하여 잘 나타나고 있음을 확인하였다.

후속연구

본 연구에서는 딥러닝 기법 중 LSTM 모형을 활용하여 컨테이너 물동량 예측을 시도하였으며, 이는 딥러닝을 활용한 컨테이너 물동량 예측 및 분석과 관련된 기초연구로 활용될 수 있는 점에서 의의를 지닌다고 할 수 있다. 또한 정확도 높은 예측치를 바탕으로 해운항만물류산업 및 항만 운영 이해관계자들에게 항만 개발 및 시설 확장을 위한 투자 의사 결정도구로 활용될 수 있으며, 터미널 운영 및 장비 활용 계획, 컨테이너 물동량 유치를 위한 마케팅 계획과 같은 항만 운영 전략 수립에 참고가 될 수 있을 것이다.
한계점 및 향후 연구 방향으로는 컨테이너 물동량에 영향을 미치는 외생변수를 포함한 다변량 딥러닝 시계열 모형의 컨테이너 물동량 예측이 필요하다. 컨테이너 물동량은 국내외 경제 상황에 영향을 많이 받기 때문에 GDP, 환율, 경기지수 등과 같은 경제지표를 포함한 컨테이너 물동량 예측이 필요하다.

질의응답

핵심어	질문	논문에서 추출한 답변
	항만 물동량 예측이란?	항만 물동량 예측은 항만 경쟁력 향상을 위한 중요한 요소이며, 항만 물동량 자료에 기초하여 시설 투자계획, 항만운영계획 등이 수립된다. 많은 선행 연구에서 ARIMA(Autoregressive integrated moving average) 모형, 인과모형, 회귀분석 등의 다양한 시계열 예측 모형을 활용하여 항만 물동량을 예측하였다.
	시계열 예측 모형을 활용하여 항만 물동량을 예측할 경우의 문제점은?	많은 선행 연구에서 ARIMA(Autoregressive integrated moving average) 모형, 인과모형, 회귀분석 등의 다양한 시계열 예측 모형을 활용하여 항만 물동량을 예측하였다. 하지만 글로벌 금융위기 이후 항만 물동량 흐름의 변동성과 복잡성이 증가하였다. 또한 선박의 대형화, 기항지의 축소와 같은 해운항만물류산업의 급격한 변화로 인해 기존 시계열 예측 방법으로는 예측 정확도 향상에 어려움이 있다(Xie, et al., 2015).
	항만 경쟁력을 높이기 위해 요구되는 것은?	또한 시설 확보가 시의적절하게 이루어지지 않는다면 물류비 상승, 수출입 경쟁력 약화, 사회적 손실 발생 등으로 항만 경쟁력이 하락한다(김범 중, 2010). 항만 경쟁력을 높이기 위해서는 항만의 면적 대형화를 통해 취항 선사 수를 증가시키기 위한 항만의 관리 운영이 요구되며(신계선, 2007), 항만에 입항하는 선박이 신속하게 하역작업을 완료 하고 출항할 수 있도록 선박의 체선 시간을 줄이는 것이 항만 경쟁력의 중요한 요소로 이를 위해서는 항만 시설의 적절한 확장이 필요하다(이민규, 2012).

참고문헌 (27)

고병욱.윤희성.김은수.최건우(2018), 컨테이너 해상물동량 예측 모형 연구, KMI.
김범중(2010), 항만시설 확보의 중요성에 대하여, 해양물류연구, 제7권, 5-14.
김정훈(2008), 시계열 모형을 이용한 부산 북항의 물동량 예측, 한국항만경제학회지, 제24권 제2호, 1-17.

원문보기 상세보기
김종길(2011), SD기법과 ARIMA를 적용한 컨테이너물동량 예측에 관한 연구, 인천대학교.
김창범(2007), 해상운송의 물동량 예측과 항만물류정책, 한국항만경제학회지, 제23권 제1호, 149-162.
민경창.하헌구(2014), SARIMA 모형을 이용한 우리나라 항만 컨테이너 물동량 예측, 한국교통학회지, 제32권 제6호, 600-614.
신계선(2007), 항만경쟁력 결정요인 분석과 부산 신항의 발전 전략에 관한 연구, 한국항만경제학회지, 제23권 제1호, 115-148.

원문보기 상세보기
신창훈.강정식.박수남.이지훈(2008), 하이브리드 ARIMA -신경망 모델을 통한 컨테이너 물동량 예측에 관한 연구, 한국항해항만학회지, 제32권 제1호, 81-88.

원문보기 상세보기
이민규(2012), 항만 서비스 혁신 관점에서의 선박 재항시간의 결정요인 분석, 한국혁신학회지, 제7권 제1호, 51-69.
이재득(2013), 승법계절 ARIMA 모형에 의한 부산항 컨테이너 물동량 추정과 예측, 한국항만경제학회지, 제29권 제3호, 1-23.

원문보기 상세보기
이지원(2008), 컨테이너 물동량을 이용한 인공신경망과 ARIMA 모형의 예측력 비교에 관한 연구, 해양대학교.
전찬영.송주미(2006), 데이터 마이닝 기법을 이용한 항만물동량 예측 활용방안 연구, KMI.
조준호.변제섭.김희철(2017), 글로벌 해운시장 현황 분석 및 시계열 모형을 이용한 부산신항 컨테이너 물동량 예측에 관한 연구, 한국정보전자통신기술학회논문지, 제10권 제4호, 295-303.

원문보기 상세보기
Brooks, M., Pallis, T. and Perkins, S.(2014), Port investment and container shipping markets, International Transport Forum Discussion Papers(OECD), No. 2014/03.
Chen, S. H. and Chen, J. N.(2010), Forecasting Container Throughputs at Ports Using Genetic Programming, Expert Systems with Applications, 37(3), 2054-2058.

상세보기
Chung, J., Gulcehre, C., Cho, K. and Bengio, Y.(2014), Empirical evaluation of gated recurrent neural networks on sequence modeling, arXiv preprint arXiv:1412.3555.
Ding, M. J., Zhang, S. Z., Zhong, H. D., Wu, Y. H. and Zhang, L. B.(2019). A Prediction Model of the Sum of Container Based on Combined BP Neural Network and SVM, Journal of Information Processing Systems, 15(2), 305-319.

원문보기 상세보기
Fang F. P. and Fang X. F.(2013), Multivariant forecasting mode of Guangdong province port throughput with genetic algorithms and Back Propagation neural network, Procedia-Social and Behavioral Sciences, 96, 1165-1174.

상세보기
Hochreiter, S. and Schmidhuber, J.(1997), Long short-term memory, Neural computation, 9(8), 1735-1780.

상세보기
LeCun, Y., Boser, B., Denker, J. S., Henderson, D., Howard, R. E., Hubbard, W. and Jackel, L. D.(1989), Backpropagation applied to handwritten zip code recognition, Neural computation, 1(4), 541-551.

상세보기
LeCun, Y., Bottou, L., Bengio, Y. and Haffner, P.(1998), Gradient-based learning applied to document recognition, Proceedings of the IEEE, 86(11), 2278-2324.

상세보기
LeCun, Y., Bengio, Y. and Hinton, G.(2015), Deep learning, Nature, 521(7553), 436-444.

상세보기
Meersman, H., Van de Voorde, E. and Vanelslander, T.(2003), Port pricing. Considerations on economic principles and marginal costs, European Journal of Transport and Infrastructure Research, 3(4), 371-386.
Raschka, S.(2018), Model evaluation, model selection, and algorithm selection in machine learning, arXiv preprint arXiv:1811.12808.
Reimers, N. and Gurevych, I.(2017), Optimal hyperparameters for deep lstm-networks for sequence labeling tasks, arXiv preprint arXiv:1707.06799.
Xie, G., Wang, S., Zhao, Y. and Lai, K. K.(2013), Hybrid approaches based on LSSVR model for container throughput forecasting: a comparative study, Applied Soft Computing, 13(5), 2232-2241.

상세보기
Zhang, C., Huang, L. and Zhao, Z.(2013), Research on combination forecast of port cargo throughput based on time series and causality analysis, Journal of Industrial Engineering and Management, 6(1), 124-134.

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증