뜰개 이동 예측을 위한 신경망 및 통계 기반 기계학습 기법의 성능 비교 Performance Comparison of Machine Learning Based on Neural Networks and Statistical Methods for Prediction of Drifter Movement원문보기
뜰개는 해양에서 해수의 특성 및 흐름을 관측하기 위한 장비로서, 해수의 흐름 관측을 이용해 유출유 확산 예측을 위해 사용될 수 있다. 본 논문에서는 관측기관에서 사용하는 뜰개가 특정 시간 간격으로 관측한 바람 및 해수의 특성과 이동경로를 기계학습 기법들을 이용하여 학습시키고 예측하는 모델을 제안한다. 서포트벡터 회귀, 방사기저함수 네트워크, 가우시안 프로세스, 다층 퍼셉트론, 순환신경망을 이용하여 뜰개의 이동경로 예측 방법을 제시한다. 기존 MOHID수치모델과 비교하여 각 기법별로 4 개의 사례중 3 개에서 성능이 개선되었으며, 가장 좋은 개선율을 보인 기법은 LSTM으로 평균 47.59% 개선되었다. 추후 연구에서는 배깅과 부스팅을 이용하여 가중치를 부여하여 정확도를 개선할 예정이다.
뜰개는 해양에서 해수의 특성 및 흐름을 관측하기 위한 장비로서, 해수의 흐름 관측을 이용해 유출유 확산 예측을 위해 사용될 수 있다. 본 논문에서는 관측기관에서 사용하는 뜰개가 특정 시간 간격으로 관측한 바람 및 해수의 특성과 이동경로를 기계학습 기법들을 이용하여 학습시키고 예측하는 모델을 제안한다. 서포트벡터 회귀, 방사기저함수 네트워크, 가우시안 프로세스, 다층 퍼셉트론, 순환신경망을 이용하여 뜰개의 이동경로 예측 방법을 제시한다. 기존 MOHID 수치모델과 비교하여 각 기법별로 4 개의 사례중 3 개에서 성능이 개선되었으며, 가장 좋은 개선율을 보인 기법은 LSTM으로 평균 47.59% 개선되었다. 추후 연구에서는 배깅과 부스팅을 이용하여 가중치를 부여하여 정확도를 개선할 예정이다.
Drifter is an equipment for observing the characteristics of seawater in the ocean, and it can be used to predict effluent oil diffusion and to observe ocean currents. In this paper, we design models or the prediction of drifter trajectory using machine learning. We propose methods for estimating th...
Drifter is an equipment for observing the characteristics of seawater in the ocean, and it can be used to predict effluent oil diffusion and to observe ocean currents. In this paper, we design models or the prediction of drifter trajectory using machine learning. We propose methods for estimating the trajectory of drifter using support vector regression, radial basis function network, Gaussian process, multilayer perceptron, and recurrent neural network. When the propose mothods were compared with the existing MOHID numerical model, performance was improve on three of the four cases. In particular, LSTM, the best performed method, showed the imporvement by 47.59% Future work will improve the accuracy by weighting using bagging and boosting.
Drifter is an equipment for observing the characteristics of seawater in the ocean, and it can be used to predict effluent oil diffusion and to observe ocean currents. In this paper, we design models or the prediction of drifter trajectory using machine learning. We propose methods for estimating the trajectory of drifter using support vector regression, radial basis function network, Gaussian process, multilayer perceptron, and recurrent neural network. When the propose mothods were compared with the existing MOHID numerical model, performance was improve on three of the four cases. In particular, LSTM, the best performed method, showed the imporvement by 47.59% Future work will improve the accuracy by weighting using bagging and boosting.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 기계학습 기반의 뜰개 예측을 통해 기존의 모델보다 정확한 모델을 제안한다. 기계학습은 데이터의 분류[4] 또는 회귀를 위해 사용되며, 본 논문에서는 회귀를 위한 기법으로 서포트벡터 회귀, 방사기저 함수, 가우시안 프로세스, 다층 퍼셉트론, 순환신경망과 이를 활용한 LSTM을 사용한다.
본 논문에서는 기존의 MOHID 수치모델을 개선하기 위해 기계학습 기법을 사용하여 기존의 뜰개의 이동경로예측을 하는 모델을 만들었다. 저자가 아는 한 뜰개 이동 경로 예측에 기계학습 기법을 적용한 최초의 시도이다.
제안 방법
최대 마진 초평면 문제에 커널 트릭을 적용해서 비선형 문제를 제안한다. 비선형 분류 알고리즘은 선형 분류알고리즘과 비슷하지만 내적 연산이 비선형 커널로 대체된다.
대상 데이터
저자가 아는 한 뜰개 이동 경로 예측에 기계학습 기법을 적용한 최초의 시도이다. 기계학습 기법으로는 SVR, RBFN, GP, MLP, RNN, LSTM 등 6 개를 사용하여 모델을 만들었다. 전체적으로 MOHID 수치모델에 비해 평균 29.
예측 모델을 만들기 위해 학습 데이터와 테스트 데이터를 구분한다. 예측모델은 교차검증을 통해 7 개의 사례 이외의 데이터를 학습 데이터로 사용하고, 해당 사례를 테스트 데이터로 사용하여 평가한다. 이 중에서 가장 많은 데이터를 보유하고 있는 사례 1, 5, 6, 7을 사용하여 평가할 것이다.
주어진 데이터는 한국해상기상기술로부터 받은 데이터로서 2015년 11월 6일부터 경도 125° 위도 36.5° 부근에서 측정한 7 개 뜰개에서 관측된 683 개의 관측자료를 담고 있다.
데이터처리
모든 실험은 교차검증(cross-validation)을 통해 평가했다. 교차검증은 지도학습 모델의 성능을 평가하기 위해 사용되는 실험 방법이다.
성능 검증을 하기 위해서는 여러 통계분석이 필요하지만 가장 중요한 기준은 정확도이다. 본 연구에서 사용할 검증 방법은 MAE(mean alsolute error), RMSE (root mean square error), NCLS(normalized cum-ulative Lagrangian seperation)의 비교를 통해 성능 검증을 하였다. MAE는 모델 평가 방법으로 많이 사용되고 있으며, RMSE는 기상, 대기 및 기후 연구에서 모델 성능을 측정할 때 표준 통계 측도로 사용되고 있다.
이론/모형
본 논문에서는 기계학습 기반의 뜰개 예측을 통해 기존의 모델보다 정확한 모델을 제안한다. 기계학습은 데이터의 분류[4] 또는 회귀를 위해 사용되며, 본 논문에서는 회귀를 위한 기법으로 서포트벡터 회귀, 방사기저 함수, 가우시안 프로세스, 다층 퍼셉트론, 순환신경망과 이를 활용한 LSTM을 사용한다. 각 기계학습 기법이 사용된 사례는 위성이미지를 활용한 유출유 발생 탐지[5], 가우시안 프로세스를 이용한 강우계 관측[6], 심층 신경망을 이용한 단기 바람예측[7], 방사기저 네트워크 기반의 유류유출 예측 시스템[8], 서포트벡터 머신-방사기저를 이용한 일사량예측[9]이 활용되었다.
성능/효과
RNN과 LSTM은 [Table 6]과 같이 에폭만 변경하여 데이터를 적용했다. 1,500부터 3,000까지 500단위로 적용하였으나 RNN은 2,500에서 가장 좋은 결과를, LSTM은 1,500에서 가장 좋은 결과를 보여줬다.
MOHID 모델 대비 기법의 정확도는 LSTM이 47.59%의 개선율을 보였고, RNN이 45.29%의 개선율을 보였다.
전체적인 비교에서 RNN과 LSTM이 가장 좋은 결과를 보여줬다. MOHID 수치모델과의 비교에서는 전체적으로 더 나은 결과를 보여줬으며 사례 6에서 RNN은 68%의 개선을 보여준다. 사례 7은 LSTM이 가장 좋은 정확도를 보였으나, 기존의 학습 모델에 비해 안 좋은 정확도를 나타냈다.
SVR은 복잡도 상수를 1에서 10까지 1의 단위로 적용하고 필터는 표준화, 정규화로 적용하여 복잡도 상수 3과 표준화가 최적의 결과를 보였다. [Table 2]와 같이 설정했다.
결과는 N 개의 구간의 평균으로 나타내었고, MAE와 RMSE는 낮을수록 정확도가 높고, NCLS는 1에 가까울수록 정확도가 높다.
MOHID 수치모델과의 비교에서는 전체적으로 더 나은 결과를 보여줬으며 사례 6에서 RNN은 68%의 개선을 보여준다. 사례 7은 LSTM이 가장 좋은 정확도를 보였으나, 기존의 학습 모델에 비해 안 좋은 정확도를 나타냈다. [Fig.
기계학습 기법으로는 SVR, RBFN, GP, MLP, RNN, LSTM 등 6 개를 사용하여 모델을 만들었다. 전체적으로 MOHID 수치모델에 비해 평균 29.61% 개선되었으며, 그 중 가장 좋은 성능을 보인 RNN과 LSTM이 각각 45.29%, 47.59%의 개선율을 보였다.
01에서 10까지 변경을 진행해보고 2가 가장 좋은 값을 가졌다. 전체적으로 개선이 되었으나, 사례 7의 결과는 안 좋게 나왔다.
각 기법 별 사례를 MAE, RMSE, NCLS 나타내고 가장 좋게 나온 것을 굵은 글씨로 표시했다. 전체적인 비교에서 RNN과 LSTM이 가장 좋은 결과를 보여줬다. MOHID 수치모델과의 비교에서는 전체적으로 더 나은 결과를 보여줬으며 사례 6에서 RNN은 68%의 개선을 보여준다.
후속연구
추후 연구 주제는 현재까지 연구한 내용을 바탕으로 앙상블을 통해 개선해 나가는 방향으로 진행할 예정이다. 구체적으로는 각각의 데이터를 바탕으로 모델을 만든 후에 가중치를 주는 배깅(bagging)과, 데이터에 여러 알고리즘으로 모델을 만든 후에 가중치를 주는 부스팅(boosting)을 통해 개선해 나아갈 예정이다. 또한 가중치 부여 방법을 성능에 따른 가중치를 할당 해주는 방법과 진화연산과 다른 기계학습 기법을 이용하여 가중치를 최적화 하는 방법을 연구할 예정이다.
구체적으로는 각각의 데이터를 바탕으로 모델을 만든 후에 가중치를 주는 배깅(bagging)과, 데이터에 여러 알고리즘으로 모델을 만든 후에 가중치를 주는 부스팅(boosting)을 통해 개선해 나아갈 예정이다. 또한 가중치 부여 방법을 성능에 따른 가중치를 할당 해주는 방법과 진화연산과 다른 기계학습 기법을 이용하여 가중치를 최적화 하는 방법을 연구할 예정이다.
추후 연구 주제는 현재까지 연구한 내용을 바탕으로 앙상블을 통해 개선해 나가는 방향으로 진행할 예정이다. 구체적으로는 각각의 데이터를 바탕으로 모델을 만든 후에 가중치를 주는 배깅(bagging)과, 데이터에 여러 알고리즘으로 모델을 만든 후에 가중치를 주는 부스팅(boosting)을 통해 개선해 나아갈 예정이다.
질의응답
핵심어
질문
논문에서 추출한 답변
뜰개란?
뜰개는 해양에서 해수의 특성 및 흐름을 관측하기 위한 장비로서, 해수의 흐름 관측을 이용해 유출유 확산 예측을 위해 사용될 수 있다. 본 논문에서는 관측기관에서 사용하는 뜰개가 특정 시간 간격으로 관측한 바람 및 해수의 특성과 이동경로를 기계학습 기법들을 이용하여 학습시키고 예측하는 모델을 제안한다.
서포트벡터 회귀는 어디에 주로 사용되는가?
서포트벡터 회귀(SVR)는 학습 데이터의 오류를 최소화 하려는 것보다 일반화된 오류를 최소화 하여 일반화된 결과를 얻으려고 하는 기법이다[10]. 기본적인 개념은 선형 회귀 함수의 계산에 기반하고 시계열 데이터 및 금융 데이터 및 손실 함수 등에 사용된다.
뜰개의 이동경로를 예측하기 위해 사용한 방법들은?
본 논문에서는 관측기관에서 사용하는 뜰개가 특정 시간 간격으로 관측한 바람 및 해수의 특성과 이동경로를 기계학습 기법들을 이용하여 학습시키고 예측하는 모델을 제안한다. 서포트벡터 회귀, 방사기저함수 네트워크, 가우시안 프로세스, 다층 퍼셉트론, 순환신경망을 이용하여 뜰개의 이동경로 예측 방법을 제시한다. 기존 MOHID 수치모델과 비교하여 각 기법별로 4 개의 사례중 3 개에서 성능이 개선되었으며, 가장 좋은 개선율을 보인 기법은 LSTM으로 평균 47.
참고문헌 (16)
Davis, R. E. "Drifter observations of coastal surface currents during CODE: the statistical and dynamical views." Journal of Geophysical Research: Oceans Vol. 90, No. C3, pp.4756-4772, 1985.
Fratantoni, D. M. "North Atlantic surface circulation during the 1990's observed with satellite-tracked drifters." Journal of Geophysical Research: Oceans Vol. 106, No. C10, pp.22067-22093, 2001.
MOHID, Water Modeling System, http://www.mohid.com
Y. D. Yun, Y. Wook. Yang, H. S. Ji, H. S. Lim, "Development of Smart Senior Classification Model based on Activity Profile Using Machine Learning Method", Journal of the Korea Convergence Society, Vol. 8, No. 1, pp.25-34, 2017.
Matkan, A. A., M. Hajeb, and Z. Azarakhsh. "Oil spill detection from SAR image using SVM based classification." ISPRS-International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences Vol. 1. No. 3, pp.55-60, 2013.
Yoo, C. S., and Park, J. Y. "Combining radar and rain gauge observations utilizing Gaussian-process basedregression and support vector learning." Journal of Korean Institute of Intelligent Systems Vol. 18, No. 3, pp.297-305, 2008.
Dalto, M., Vasak, M., Baotic, M., Matusko, J., and Horvath, K. "Neural-network-based ultra-short-term wind forecasting." European Wind Energy Association 2014 Annual Event 2014.
Baruque, B., Corchado, E., Mata, A., and Corchado, J. M. "forecasting solution to the oil spill problem based on a hybrid intelligent system." Information Sciences Vol. 180, No.10, pp.2029-2043, 2010.
Ramedani, Z., Omid, M., Keyhani, A., Shamshirband, S. and Khoshnevisan, B. "Potential of radial basis function based support vector regression for global solar radiation prediction." Renewable and Sustainable Energy Reviews 39, pp.1005-1011, 2014.
Basak, D., Pal, S., and Patranabis, D. C. "Support vector regression." Neural Information Processing-Letters and Reviews Vol. 11, No. 10, pp.203-224, 2007.
Orr, M. J. Introduction to Radial Basis Function Networks, Institute for Adaptive and Neural Computation, Edinburgh Univ 1996.
Rasmussen, C. E., and Williams, C. K. Gaussian Processes for Machine Learning. Vol. 1. MIT press 2006.
Gardner, M. W., and Dorling, S. R. "Artificial neural networks (the multilayer perceptron)-a review of applications in the atmospheric sciences." Atmospheric Environment Vol. 32, No. 14, pp.2627-2636, 1998.
Mikolov, Tomas, et al. "Recurrent neural network based language model." Interspeech. Vol. 2. 2010.
Sak, Hasim, Andrew Senior, and Francoise Beaufays. "Long short-term memory recurrent neural network architectures for large scale acoustic modeling." Fifteenth Annual Conference of the International Speech Communication Association. 2014.
Liu, Y., and Weisberg, R. H. "Evaluation of trajectory modeling in different dynamic regions using normalized cumulative Lagrangian separation." Journal of Geophysical Research: Oceans Vol. 116, No.C9, 2011.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.