신경망 및 통계 기법 기반의 기계학습을 이용한 유류유출 및 기상 예측 연구 동향 A Survey on Oil Spill and Weather Forecast Using Machine Learning Based on Neural Networks and Statistical Methods원문보기
정확한 예측은 미래에 일어날 현상에 대해 효과적으로 준비 혹은 대처 할 수 있게 해준다. 특히, 기상 현상은 인간의 생활과 밀접한 연관이 있으며, 발생할 수 있는 기상 및 재난 예측을 통해 인명, 재산 등의 피해로부터 예방 할 수 있게 해준다. 해상에서 발생할 수 있는 재난 중 하나인 유류유출 사고에 대해 빠르고 효과적으로 대응하기 위해서는 유출유의 이동과 주변 해역의 기상을 정확하게 예측하는 것이 중요하다. 본 논문에서는 분류 및 회귀 예측과 관련된 연구에서 준수한 성능 및 예측 가능성을 보여준 기계학습 기법으로 서포트 벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저함수 네트워크의 총 4 개의 기계학습 기법을 선별하였다. 선별한 기계학습 기법을 이용하여 유류유출의 탐지와 바람, 강우량, 오존 등의 기상 데이터를 예측하는 연구들의 연구 방법과 결과 등을 설명하며 이를 활용한 기계학습 기반 유류유출 예측 모델의 적용 가능성을 제시한다.
정확한 예측은 미래에 일어날 현상에 대해 효과적으로 준비 혹은 대처 할 수 있게 해준다. 특히, 기상 현상은 인간의 생활과 밀접한 연관이 있으며, 발생할 수 있는 기상 및 재난 예측을 통해 인명, 재산 등의 피해로부터 예방 할 수 있게 해준다. 해상에서 발생할 수 있는 재난 중 하나인 유류유출 사고에 대해 빠르고 효과적으로 대응하기 위해서는 유출유의 이동과 주변 해역의 기상을 정확하게 예측하는 것이 중요하다. 본 논문에서는 분류 및 회귀 예측과 관련된 연구에서 준수한 성능 및 예측 가능성을 보여준 기계학습 기법으로 서포트 벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저함수 네트워크의 총 4 개의 기계학습 기법을 선별하였다. 선별한 기계학습 기법을 이용하여 유류유출의 탐지와 바람, 강우량, 오존 등의 기상 데이터를 예측하는 연구들의 연구 방법과 결과 등을 설명하며 이를 활용한 기계학습 기반 유류유출 예측 모델의 적용 가능성을 제시한다.
Accurate forecasting enables to effectively prepare for future phenomenon. Especially, meteorological phenomenon is closely related with human life, and it can prevent from damage such as human life and property through forecasting of weather and disaster that can occur. To respond quickly and effec...
Accurate forecasting enables to effectively prepare for future phenomenon. Especially, meteorological phenomenon is closely related with human life, and it can prevent from damage such as human life and property through forecasting of weather and disaster that can occur. To respond quickly and effectively to oil spill accidents, it is important to accurately predict the movement of oil spills and the weather in the surrounding waters. In this paper, we selected four representative machine learning techniques: support vector machine, Gaussian process, multilayer perceptron, and radial basis function network that have shown good performance and predictability in the previous studies related to oil spill detection and prediction in meteorology such as wind, rainfall and ozone. we suggest the applicability of oil spill prediction model based on machine learning.
Accurate forecasting enables to effectively prepare for future phenomenon. Especially, meteorological phenomenon is closely related with human life, and it can prevent from damage such as human life and property through forecasting of weather and disaster that can occur. To respond quickly and effectively to oil spill accidents, it is important to accurately predict the movement of oil spills and the weather in the surrounding waters. In this paper, we selected four representative machine learning techniques: support vector machine, Gaussian process, multilayer perceptron, and radial basis function network that have shown good performance and predictability in the previous studies related to oil spill detection and prediction in meteorology such as wind, rainfall and ozone. we suggest the applicability of oil spill prediction model based on machine learning.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 기계학습을 이용하여 유류유출 및 기상을 예측하는 연구들에 대해 소개하였다. 유류유출 예측 연구는 위성사진과 같은 이미지 데이터와 주변 기상데이터를 이용하여 유류유출 발생 여부를 효과적으로 탐지 및 예측하였으나, 유류유출 발생 이후의 유출유의 확산 예측은 어려워 보였다.
본 논문에서는 예측과 기계학습을 이용해 자연에 심각한 피해를 입힐 수 있는 재해의 일종인 유류유출 사고를 대응하기 위한 연구들을 소개하며, 추가로 유출 상황에서 관련이 있는 바람, 해수 등의 기상을 예측하기 위한 최근 10 년간의 연구를 소개한다. 2 절에서는 본 논문에서 소개하는 유류유출 및 기상 예측 문제의 특징들을 유형별로 나누어 소개한다.
본 논문에서는 향후 연구 방향으로 유출 사고가 발생했을 경우 유출유의 확산을 기계학습을 이용하여 예측하는 연구를 진행하고자 한다. 유출 사고가 발생한 해역의 해류, 바람 등의 기상 데이터를 수집하고 신경망 및 통계 기법 기반의 기계학습 기법들을 이용해 유출유의 확산과 기상 데이터의 관계를 파악, 유출유 이동 및 확산을 예측하는 연구를 수행할 예정이며, 관련 연구로 데이터의 정확도 향상을 위한 데이터 보정 연구, 기계학습과 앙상블 기법을 이용한 유출유 예측 연구를 수행할 예정이다.
해역을 촬영한 위성 이미지 데이터를 사용하였으며, 물의 특성을 분석하여 이미지 상에서 강도, 색조, 채도 등으로 나누어 특징을 추출하는 방법으로 실험을 진행하였다. 이 연구에서는 자동인코더를 심층 신경망 구조로 구성한 누적 희소 자동인코더 모델을 제안하였다. 실험은 모델에 학습데이터 5만, 15만, 25만, 50만, 75만 개를 학습했을 때의 정확도를 비교하였으며, 서포트 벡터 머신, 인공신경망의 예측 결과와 비교하는 방식으로 진행하였다.
특히, 자연 현상 예측은 인간의 평소 생활뿐만 아니라 지진이나 홍수, 태풍 같은 재난으로 인해 발생할 수 있는 심각한 피해를 방지하기 위해 시대를 불문하고 동·식물의 모습, 별자리 관측 등의 방법부터 근래에는 여러 기계장치와 컴퓨터를 이용한 방법까지 다양한 방식으로 예측을 하고자 노력하였다[2].
제안 방법
Tagliaferri 등[8]은 인공신경망과 서포트 벡터 회귀를 이용해 풍향의 변화를 예측하는 연구를 진행하였다. 2013년 샌프란시스코에서 진행된 국제요트대회인 34회 아메리카 컵에서 수집한 데이터를 사용하였으며, 과거의 데이터로부터 특정 시점의 풍향을 예측하고 실제 측정값과 오차를 비교하는 방법으로 연구를 진행하였다. 실험은 1분 단위 예측과 2분 단위 예측으로 진행하였으며, 실험에 사용된 인공신경망은 매트랩으로 구현된 피드포워드(Feed- forward) 다층 퍼셉트론을 사용, 서포트 벡터 머신은 LIBSVM 라이브러리[9]를 사용하여 구현하였다.
본 논문에서 주제로 선정한 기계학습 기법은 서포트벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저 함수 네트워크의 4 가지다. 다양한 기계학습 기법들 중 유류유출 및 기상 예측 문제의 데이터 형태인 이미지와 시계열 데이터를 이용한 분류 및 회귀 분석에 적합한 기계학습 기법을 선정하였으며, 그 중 우수한 성능과 많은 연구에서 사용되는 기법으로 선정해 연구를 진행하였다. 최근 10 년간 진행된 예측과 관련된 연구를 기계학습 기법별로 정리한 결과는 다음의 [Table 1]과 같다.
유류유출 사고는 기름이 유출된 곳과 범위를 빠르게 파악하고 이동을 예측하여 확산을 방지하는 게 중요하다. 본 논문에서 조사한 유류유출 예측 문제의 유형으로는 첫 번째, 레이더, 위성사진 등의 이미지 데이터를 이용하여 기름이 유출된 부분을 기계학습을 통해 분류하는 문제, 두 번째, 평상시의 관측데이터와 유출 사고 발생 시의 관측 데이터를 수집하고 새로 관측된 데이터를 기계학습을 이용해 기존의 데이터와 비교하여 유류유출 여부를 판단하는 문제로 2 가지 유형의 문제가 있다.
2013년 샌프란시스코에서 진행된 국제요트대회인 34회 아메리카 컵에서 수집한 데이터를 사용하였으며, 과거의 데이터로부터 특정 시점의 풍향을 예측하고 실제 측정값과 오차를 비교하는 방법으로 연구를 진행하였다. 실험은 1분 단위 예측과 2분 단위 예측으로 진행하였으며, 실험에 사용된 인공신경망은 매트랩으로 구현된 피드포워드(Feed- forward) 다층 퍼셉트론을 사용, 서포트 벡터 머신은 LIBSVM 라이브러리[9]를 사용하여 구현하였다. 연구 결과, 두 방법 모두 1분 단위 예측이 2분 단위 예측에 비해 오차가 적었으며, 인공신경망의 경우 계층당 신경의 개수가 20여 개 정도가 되었을 때 효율이 가장 높았다.
테헤란 지역의 730 ㎢ 부분에서 관측된 온도, 습도 등의 기상 정보를 데이터로 사용하였으며, 서포트 벡터 머신에 회귀함수 추정문제를 풀기 위해 몇 가지 변수를 더한 알고리즘인 서포트 벡터 회귀를 주로 사용하면서 방사기저함수를 커널함수로 사용하는 SVR-RBF 모델을 통해 예측을 진행하였다. 실험은 SVR-RBF 모델과 기존에 사용하였던 인공신경망, 서포트 벡터 머신과 비교하였으며, 각 알고리즘을 학습한 이후 예측 값과 실제 값의 차이를 비교하는 방식으로 평가하였다. 실험 결과, SVR-RBF 모델이 타 알고리즘보다 중심 밀집도가 높았으며, 데이터 표본 수에 따라 정확도가 최대 93%까지 향상되는 결과를 보였다.
이 연구에서는 자동인코더를 심층 신경망 구조로 구성한 누적 희소 자동인코더 모델을 제안하였다. 실험은 모델에 학습데이터 5만, 15만, 25만, 50만, 75만 개를 학습했을 때의 정확도를 비교하였으며, 서포트 벡터 머신, 인공신경망의 예측 결과와 비교하는 방식으로 진행하였다. 실험 결과, 학습데이터 75만 개를 사용한 희소 자동인코더 모델이 가장 높은 정확도를 보였으며, 은닉층이 두 개일 때 최적의 결과를 보였다.
이전에 발생했던 유류유출 사고에서 관측한 데이터 및 위성 이미지를 데이터로 사용하였으며, 기존의 데이터와 새로 측정된 데이터 및 이미지를 이용하여 유류유출 여부를 판단하는 사례기반추론 방법과 방사기저함수에 기존에 저장된 데이터를 학습시켜 새로운 타입의 데이터를 추출하고 추출된 데이터들을 평가 및 선별하여 다시 저장된 데이터를 업데이트하는 방법을 이용하였다. 실험은 방사기저함수 모델과 사례기반추론 모델, 사례기반추론에 방사기저함수를 이용한 데이터 보정이 추가된 모델의 예측 결과를 비교하는 방식으로 진행되었다. 실험 결과, 방사기저함수를 단독으로 사용한 경우보다 데이터 보정을 위한 방안으로 사용 할 경우 더 높은 정확도를 보였다.
크로아티아의 스플리트, 시베니크, 크닌 세 곳에서 측정한 풍향과 풍속 데이터를 이용하였으며, 동쪽 방향의 벡터와 북쪽 방향의 벡터로 나누어 사용했다. 실험은 입력 변수 선택을 하지 않고 학습한 신경망과 입력 변수 선택을 이용하여 학습한 신경망으로 나누어 예측을 진행하였으며, 입력 변수 선택은 신경망 학습 시 사용되는 데이터 중 중복되는 값을 배제하여 효율적이고 빠르게 학습시키기 위한 방법이다. 예측 결과는 얕은 신경망(shallow neural network)의 예측 값과 함께 평균 절대 오차(MAE)를 통해 비교하였다.
Topouzelis 등[17]은 방사기저함수와 다층 퍼셉트론을 이용한 유류유출 예측 연구를 진행하였다. 위성으로 촬영한 합성개구레이더 이미지를 전처리를 통해 2,000 개의 학습데이터로 나누어 사용하였으며, 이미지에 나온 바다의 어두운 부분, 빛의 산란을 이용해 유류유출을 판단 할 수 있다는 점을 이용하여 학습영역을 유출영역과 비유출영역, 유출처럼 보이는 영역으로 나누어 학습을 진행하였다. 실험 결과, 다층 퍼셉트론은 두 종류의 입력만 받으면 예측 정확도가 많이 떨어졌으며, 입력의 가짓수를 늘리면 좋은 예측 정확도를 보이지만 시간이 오래 걸렸다.
Matkan 등[7]은 서포트 벡터 머신을 이용해 유류유출을 탐지하는 연구를 진행하였다. 위성으로 촬영한 합성개구레이더(SAR) 이미지를 데이터로 사용하였으며, 이미지를 HH(horizontal- horizontal) 채널 이미지와 VV(vertical-vertical) 채널 이미지로 추출하여 파울리,크로게이거, 프리먼의 총 3 가지 방법으로 분해하여 특성을 분석하는 방법으로 연구를 진행하였다. 이미지를 분해하면 후방 산란(back scattering)을 일으키는 물질의 표면, 부피와 이면각(dihedral) 산란 같은 물리적 특성과 연관 지을 수 있다는 점을 이용하였으며, 제안한 알고리즘을 통해 산란도, 가간섭성(coherency) 등의 수치를 도출하여 분류하였다.
강우량 측정에 있어서 레이더는 넓은 범위의 관측이 가능하나 데이터의 정확도가 낮으며, 강우계는 정밀한 측정이 가능하나 수집 위치가 제한적이라 관측 데이터가 상대적으로 적다. 이 연구에서는 강우계의 적은 데이터를 보충하기 위해 함수 근사기법을 사용하였으며, 도출된 강우계 관측 데이터에 가우시안 프로세스 기반 조건부 병합 전략을 이용해 레이더 관측 데이터와 크리깅 알고리즘을 적용하여 데이터를 보정하였다. 실험에는 한국의 강원, 경북, 충북 지역의 레이더 강우 데이터와 건설교통부(MOCT)에 의해 측정된 지상강우량 데이터를 이용하였으며, 실측값과 예측값을 평균 절대 오차를 이용해 비교하였다.
오존은 농도가 특정 수치보다 높아질수록 인간과 식물에게 해를 끼치게 되며, 이를 방지하기 위한 농도 예측이 필요하다. 이 연구에서는 진화 가우시안 프로세스와 다층 퍼셉트론 신경망에 바람, 온도, 기압, 먼지, 오염 가스 등의 오존에 영향을 미칠 수 있는 데이터들을 학습시켜 오존의 농도를 예측하는 방법을 이용하였다. 진화 가우시안 프로세스는 기존의 가우시안 프로세스에서 학습 데이터의 양이 많아질수록 계산 복잡도가 커지는 문제를 해결하기 위해 활성 집합이라는 학습 데이터의 수를 조절하는 방법을 적용한 기법이다.
위성으로 촬영한 합성개구레이더(SAR) 이미지를 데이터로 사용하였으며, 이미지를 HH(horizontal- horizontal) 채널 이미지와 VV(vertical-vertical) 채널 이미지로 추출하여 파울리,크로게이거, 프리먼의 총 3 가지 방법으로 분해하여 특성을 분석하는 방법으로 연구를 진행하였다. 이미지를 분해하면 후방 산란(back scattering)을 일으키는 물질의 표면, 부피와 이면각(dihedral) 산란 같은 물리적 특성과 연관 지을 수 있다는 점을 이용하였으며, 제안한 알고리즘을 통해 산란도, 가간섭성(coherency) 등의 수치를 도출하여 분류하였다. 실험 결과, HH 채널을 이용한 분류보다 VV채널을 이용한 분류가 더 좋은 결과를 보였으며, 파울리, 크로게이거, 프리먼 분해를 통한 분류에서는 크로게이거 분해를 이용한 분류가 높은 정확도를 보였다.
Baruque 등[16]은 방사기저함수와 사례기반추론 모델을 이용한 유류유출 예측 연구를 진행하였다. 이전에 발생했던 유류유출 사고에서 관측한 데이터 및 위성 이미지를 데이터로 사용하였으며, 기존의 데이터와 새로 측정된 데이터 및 이미지를 이용하여 유류유출 여부를 판단하는 사례기반추론 방법과 방사기저함수에 기존에 저장된 데이터를 학습시켜 새로운 타입의 데이터를 추출하고 추출된 데이터들을 평가 및 선별하여 다시 저장된 데이터를 업데이트하는 방법을 이용하였다. 실험은 방사기저함수 모델과 사례기반추론 모델, 사례기반추론에 방사기저함수를 이용한 데이터 보정이 추가된 모델의 예측 결과를 비교하는 방식으로 진행되었다.
Ramedani 등[18]은 서포트 벡터 머신-방사기저함수(SVM-RBF)를 이용하여 일사량을 예측하는 연구를 진행하였다. 테헤란 지역의 730 ㎢ 부분에서 관측된 온도, 습도 등의 기상 정보를 데이터로 사용하였으며, 서포트 벡터 머신에 회귀함수 추정문제를 풀기 위해 몇 가지 변수를 더한 알고리즘인 서포트 벡터 회귀를 주로 사용하면서 방사기저함수를 커널함수로 사용하는 SVR-RBF 모델을 통해 예측을 진행하였다. 실험은 SVR-RBF 모델과 기존에 사용하였던 인공신경망, 서포트 벡터 머신과 비교하였으며, 각 알고리즘을 학습한 이후 예측 값과 실제 값의 차이를 비교하는 방식으로 평가하였다.
Yang 등[15]은 심층 신경망을 이용하여 수역 인식 및 추출 방법에 대한 연구를 진행하였다. 해역을 촬영한 위성 이미지 데이터를 사용하였으며, 물의 특성을 분석하여 이미지 상에서 강도, 색조, 채도 등으로 나누어 특징을 추출하는 방법으로 실험을 진행하였다. 이 연구에서는 자동인코더를 심층 신경망 구조로 구성한 누적 희소 자동인코더 모델을 제안하였다.
대상 데이터
본 논문에서 주제로 선정한 기계학습 기법은 서포트벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저 함수 네트워크의 4 가지다. 다양한 기계학습 기법들 중 유류유출 및 기상 예측 문제의 데이터 형태인 이미지와 시계열 데이터를 이용한 분류 및 회귀 분석에 적합한 기계학습 기법을 선정하였으며, 그 중 우수한 성능과 많은 연구에서 사용되는 기법으로 선정해 연구를 진행하였다.
이 연구에서는 일정 시간 동안 수집한 풍속 데이터를 서포트 벡터 회귀 모델과 역전파 신경망에 학습시키고 특정 시점의 풍속을 예측하여 실제 데이터와의 차이를 평균 제곱 오차와 평균 절대 오차를 이용하여 비교하였다. 실험에는 스웨덴 KTH 풍력 발전소에서 35일 동안 매 10분의 평균으로 측정한 5,040 개의 데이터를 사용하였으며, 4,500 개의 데이터를 학습에 사용하고, 540 개의 데이터를 테스트에 사용하였다. 실험 결과, 서포트 벡터 회귀 모델이 역전파 신경망보다 더 작은 편차를 보였으며, 정확도 또한 더 높은 결과를 보여주었다.
진화 가우시안 프로세스는 기존의 가우시안 프로세스에서 학습 데이터의 양이 많아질수록 계산 복잡도가 커지는 문제를 해결하기 위해 활성 집합이라는 학습 데이터의 수를 조절하는 방법을 적용한 기법이다. 실험에는 슬로베니아의 노바 고리차에 설치된 자동 공기 오염 측정국(ANAS)에서 측정된 바람, 온도, 상대 습도, 기압, 먼지, 오염 가스 등의 데이터를 사용하였으며, 총 556 개의 데이터 중 488 개를 학습데이터로 사용하고, 68 개의 데이터를 테스트 데이터로 사용하였다. 실험 결과, 진화 가우시안 프로세스의 활성 집합의 크기가 100, 150 개일 경우 다층 퍼셉트론과 비슷한 결과를 보였으며, 특히 200 개 일 경우 정확도 95% 정도로 경보 시스템에 사용할 수 있을 만큼 높은 정확도를 보였다.
이 연구에서는 강우계의 적은 데이터를 보충하기 위해 함수 근사기법을 사용하였으며, 도출된 강우계 관측 데이터에 가우시안 프로세스 기반 조건부 병합 전략을 이용해 레이더 관측 데이터와 크리깅 알고리즘을 적용하여 데이터를 보정하였다. 실험에는 한국의 강원, 경북, 충북 지역의 레이더 강우 데이터와 건설교통부(MOCT)에 의해 측정된 지상강우량 데이터를 이용하였으며, 실측값과 예측값을 평균 절대 오차를 이용해 비교하였다. 실험 결과, 조건부 병합 전략을 사용할 경우 약 5%의 정확도가 향상되었다.
홍콩 기상청에서 제공받은 30 년간의 기온, 이슬점, 평균 해면 기압, 풍향 및 풍속 등의 데이터를 사용하였으며, 심층 신경망 학습을 이용하여 예측 방법을 사용하였다. 실험은 약 26만 개의 데이터 중에서 23만 개를 학습 데이터로 사용하고, 2만 6천 개의 데이터를 테스트 데이터로 사용하였다. 예측 결과를 비교하기 위해 기본적인 서포트 벡터 회귀와 서포트 벡터 회귀 계층을 최상위 계층으로 가지는 심층 신경망 모델을 사용하였으며, 예측의 정확도 평가를 위해서 정규 평균 제곱오차, 방향 대칭성, 결정계수를 사용하여 비교하였다.
Đalto 등[14]은 심층 신경망을 이용하여 바람을 예측하는 연구를 진행하였다. 크로아티아의 스플리트, 시베니크, 크닌 세 곳에서 측정한 풍향과 풍속 데이터를 이용하였으며, 동쪽 방향의 벡터와 북쪽 방향의 벡터로 나누어 사용했다. 실험은 입력 변수 선택을 하지 않고 학습한 신경망과 입력 변수 선택을 이용하여 학습한 신경망으로 나누어 예측을 진행하였으며, 입력 변수 선택은 신경망 학습 시 사용되는 데이터 중 중복되는 값을 배제하여 효율적이고 빠르게 학습시키기 위한 방법이다.
Liu 등[13]은 심층 신경망과 서포트 벡터 머신 알고리즘을 이용하여 날씨 예측 연구를 진행하였다. 홍콩 기상청에서 제공받은 30 년간의 기온, 이슬점, 평균 해면 기압, 풍향 및 풍속 등의 데이터를 사용하였으며, 심층 신경망 학습을 이용하여 예측 방법을 사용하였다. 실험은 약 26만 개의 데이터 중에서 23만 개를 학습 데이터로 사용하고, 2만 6천 개의 데이터를 테스트 데이터로 사용하였다.
데이터처리
실험은 입력 변수 선택을 하지 않고 학습한 신경망과 입력 변수 선택을 이용하여 학습한 신경망으로 나누어 예측을 진행하였으며, 입력 변수 선택은 신경망 학습 시 사용되는 데이터 중 중복되는 값을 배제하여 효율적이고 빠르게 학습시키기 위한 방법이다. 예측 결과는 얕은 신경망(shallow neural network)의 예측 값과 함께 평균 절대 오차(MAE)를 통해 비교하였다. 실험 결과, 얕은 신경망보다 심층 신경망을 이용한 예측이 더 높은 정확도를 보였으며, 입력 변수 선택을 사용하지 않은 경우보다 입력 변수 선택을 사용한 심층 신경망이 더 높은 예측 정확도를 보였다.
실험은 약 26만 개의 데이터 중에서 23만 개를 학습 데이터로 사용하고, 2만 6천 개의 데이터를 테스트 데이터로 사용하였다. 예측 결과를 비교하기 위해 기본적인 서포트 벡터 회귀와 서포트 벡터 회귀 계층을 최상위 계층으로 가지는 심층 신경망 모델을 사용하였으며, 예측의 정확도 평가를 위해서 정규 평균 제곱오차, 방향 대칭성, 결정계수를 사용하여 비교하였다. 실험 결과, 기온과 이슬점 예측에서 두 예측 모델 모두 매우 높은 정확도를 보였으며, 풍속 예측에서도 높은 정확도를 보여주었다.
풍력 발전의 효율은 풍력 조건에 따라 결정되며, 풍속 및 풍향은 지형 및 장애물로 인해 자주 변화한다. 이 연구에서는 일정 시간 동안 수집한 풍속 데이터를 서포트 벡터 회귀 모델과 역전파 신경망에 학습시키고 특정 시점의 풍속을 예측하여 실제 데이터와의 차이를 평균 제곱 오차와 평균 절대 오차를 이용하여 비교하였다. 실험에는 스웨덴 KTH 풍력 발전소에서 35일 동안 매 10분의 평균으로 측정한 5,040 개의 데이터를 사용하였으며, 4,500 개의 데이터를 학습에 사용하고, 540 개의 데이터를 테스트에 사용하였다.
이론/모형
일반적으로 3 ∼ 6 개 정도의 층을 두며, 이들은 각각 입력층, 은닉층, 출력층으로 구분된다. 기존의 선형 분리만 가능했던 단층 퍼셉트론의 문제점을 해결하고자 고안되었으며, 역전파(back-propagation) 알고리즘을 이용하여 학습한다.
방사기저함수 네트워크 구조는 다층 퍼셉트론과 비슷한 구조를 가지며, 입력층, 하나의 은닉층, 출력층으로 구분된다. 은닉층에는 확률가우시안 함수가 적용되어 있으며, 역전파 알고리즘을 이용하여 학습한다.
성능/효과
연구 결과, 두 방법 모두 1분 단위 예측이 2분 단위 예측에 비해 오차가 적었으며, 인공신경망의 경우 계층당 신경의 개수가 20여 개 정도가 되었을 때 효율이 가장 높았다. 100분의 데이터를 이용해 테스트한 결과 인공신경망의 경 경우 75%의 정확도를 보여줬으며, 서포트 벡터 머신의 경우 85%의 정확도를 보여주었다.
유류유출 예측 연구는 위성사진과 같은 이미지 데이터와 주변 기상데이터를 이용하여 유류유출 발생 여부를 효과적으로 탐지 및 예측하였으나, 유류유출 발생 이후의 유출유의 확산 예측은 어려워 보였다. 기상 예측 연구는 바람, 오존, 강우량 등의 기상 관련 요소를 관측한 데이터와 다양한 기계학습 기법들을 이용하여 효과적으로 예측하였으며 정확도 또한 높은 결과를 보여주었다. 이러한 연구 결과 들을 종합해보면 유류유출 및 기상 관련 요소들을 기계학습을 이용해 단기간의 변화를 효과적으로 예측이 가능하다는 것을 보여주었으며, 다양한 시계열 데이터를 이용한 예측을 진행할 때, 기계학습 적용을 통한 효과적인 예측 가능성을 보여주었다.
실험 결과, 다층 퍼셉트론은 두 종류의 입력만 받으면 예측 정확도가 많이 떨어졌으며, 입력의 가짓수를 늘리면 좋은 예측 정확도를 보이지만 시간이 오래 걸렸다. 방사기저함수는 프로토타입 벡터값에 따라 결과가 많이 달라졌으며 비교적 낮은 정확도를 보였지만, 학습시간을 충분히 주게 되면 모델의 최적화를 통해 예측 속도 및 정확도가 향상되는 것을 보였다.
이미지를 분해하면 후방 산란(back scattering)을 일으키는 물질의 표면, 부피와 이면각(dihedral) 산란 같은 물리적 특성과 연관 지을 수 있다는 점을 이용하였으며, 제안한 알고리즘을 통해 산란도, 가간섭성(coherency) 등의 수치를 도출하여 분류하였다. 실험 결과, HH 채널을 이용한 분류보다 VV채널을 이용한 분류가 더 좋은 결과를 보였으며, 파울리, 크로게이거, 프리먼 분해를 통한 분류에서는 크로게이거 분해를 이용한 분류가 높은 정확도를 보였다.
실험은 SVR-RBF 모델과 기존에 사용하였던 인공신경망, 서포트 벡터 머신과 비교하였으며, 각 알고리즘을 학습한 이후 예측 값과 실제 값의 차이를 비교하는 방식으로 평가하였다. 실험 결과, SVR-RBF 모델이 타 알고리즘보다 중심 밀집도가 높았으며, 데이터 표본 수에 따라 정확도가 최대 93%까지 향상되는 결과를 보였다.
예측 결과를 비교하기 위해 기본적인 서포트 벡터 회귀와 서포트 벡터 회귀 계층을 최상위 계층으로 가지는 심층 신경망 모델을 사용하였으며, 예측의 정확도 평가를 위해서 정규 평균 제곱오차, 방향 대칭성, 결정계수를 사용하여 비교하였다. 실험 결과, 기온과 이슬점 예측에서 두 예측 모델 모두 매우 높은 정확도를 보였으며, 풍속 예측에서도 높은 정확도를 보여주었다. 평균 해면 기압 예측의 경우, 결과가 좋지 않았으나 서포트 벡터 회귀모델보다 심층 신경망 모델이 더 좋은 결과를 보였다.
위성으로 촬영한 합성개구레이더 이미지를 전처리를 통해 2,000 개의 학습데이터로 나누어 사용하였으며, 이미지에 나온 바다의 어두운 부분, 빛의 산란을 이용해 유류유출을 판단 할 수 있다는 점을 이용하여 학습영역을 유출영역과 비유출영역, 유출처럼 보이는 영역으로 나누어 학습을 진행하였다. 실험 결과, 다층 퍼셉트론은 두 종류의 입력만 받으면 예측 정확도가 많이 떨어졌으며, 입력의 가짓수를 늘리면 좋은 예측 정확도를 보이지만 시간이 오래 걸렸다. 방사기저함수는 프로토타입 벡터값에 따라 결과가 많이 달라졌으며 비교적 낮은 정확도를 보였지만, 학습시간을 충분히 주게 되면 모델의 최적화를 통해 예측 속도 및 정확도가 향상되는 것을 보였다.
실험은 방사기저함수 모델과 사례기반추론 모델, 사례기반추론에 방사기저함수를 이용한 데이터 보정이 추가된 모델의 예측 결과를 비교하는 방식으로 진행되었다. 실험 결과, 방사기저함수를 단독으로 사용한 경우보다 데이터 보정을 위한 방안으로 사용 할 경우 더 높은 정확도를 보였다.
실험에는 스웨덴 KTH 풍력 발전소에서 35일 동안 매 10분의 평균으로 측정한 5,040 개의 데이터를 사용하였으며, 4,500 개의 데이터를 학습에 사용하고, 540 개의 데이터를 테스트에 사용하였다. 실험 결과, 서포트 벡터 회귀 모델이 역전파 신경망보다 더 작은 편차를 보였으며, 정확도 또한 더 높은 결과를 보여주었다.
예측 결과는 얕은 신경망(shallow neural network)의 예측 값과 함께 평균 절대 오차(MAE)를 통해 비교하였다. 실험 결과, 얕은 신경망보다 심층 신경망을 이용한 예측이 더 높은 정확도를 보였으며, 입력 변수 선택을 사용하지 않은 경우보다 입력 변수 선택을 사용한 심층 신경망이 더 높은 예측 정확도를 보였다.
실험에는 한국의 강원, 경북, 충북 지역의 레이더 강우 데이터와 건설교통부(MOCT)에 의해 측정된 지상강우량 데이터를 이용하였으며, 실측값과 예측값을 평균 절대 오차를 이용해 비교하였다. 실험 결과, 조건부 병합 전략을 사용할 경우 약 5%의 정확도가 향상되었다.
실험에는 슬로베니아의 노바 고리차에 설치된 자동 공기 오염 측정국(ANAS)에서 측정된 바람, 온도, 상대 습도, 기압, 먼지, 오염 가스 등의 데이터를 사용하였으며, 총 556 개의 데이터 중 488 개를 학습데이터로 사용하고, 68 개의 데이터를 테스트 데이터로 사용하였다. 실험 결과, 진화 가우시안 프로세스의 활성 집합의 크기가 100, 150 개일 경우 다층 퍼셉트론과 비슷한 결과를 보였으며, 특히 200 개 일 경우 정확도 95% 정도로 경보 시스템에 사용할 수 있을 만큼 높은 정확도를 보였다.
실험은 모델에 학습데이터 5만, 15만, 25만, 50만, 75만 개를 학습했을 때의 정확도를 비교하였으며, 서포트 벡터 머신, 인공신경망의 예측 결과와 비교하는 방식으로 진행하였다. 실험 결과, 학습데이터 75만 개를 사용한 희소 자동인코더 모델이 가장 높은 정확도를 보였으며, 은닉층이 두 개일 때 최적의 결과를 보였다. 학습데이터의 크기가 클수록 정확도가 증가하는 결과를 보였다.
실험은 1분 단위 예측과 2분 단위 예측으로 진행하였으며, 실험에 사용된 인공신경망은 매트랩으로 구현된 피드포워드(Feed- forward) 다층 퍼셉트론을 사용, 서포트 벡터 머신은 LIBSVM 라이브러리[9]를 사용하여 구현하였다. 연구 결과, 두 방법 모두 1분 단위 예측이 2분 단위 예측에 비해 오차가 적었으며, 인공신경망의 경우 계층당 신경의 개수가 20여 개 정도가 되었을 때 효율이 가장 높았다. 100분의 데이터를 이용해 테스트한 결과 인공신경망의 경 경우 75%의 정확도를 보여줬으며, 서포트 벡터 머신의 경우 85%의 정확도를 보여주었다.
기상 예측 연구는 바람, 오존, 강우량 등의 기상 관련 요소를 관측한 데이터와 다양한 기계학습 기법들을 이용하여 효과적으로 예측하였으며 정확도 또한 높은 결과를 보여주었다. 이러한 연구 결과 들을 종합해보면 유류유출 및 기상 관련 요소들을 기계학습을 이용해 단기간의 변화를 효과적으로 예측이 가능하다는 것을 보여주었으며, 다양한 시계열 데이터를 이용한 예측을 진행할 때, 기계학습 적용을 통한 효과적인 예측 가능성을 보여주었다.
실험 결과, 기온과 이슬점 예측에서 두 예측 모델 모두 매우 높은 정확도를 보였으며, 풍속 예측에서도 높은 정확도를 보여주었다. 평균 해면 기압 예측의 경우, 결과가 좋지 않았으나 서포트 벡터 회귀모델보다 심층 신경망 모델이 더 좋은 결과를 보였다.
실험 결과, 학습데이터 75만 개를 사용한 희소 자동인코더 모델이 가장 높은 정확도를 보였으며, 은닉층이 두 개일 때 최적의 결과를 보였다. 학습데이터의 크기가 클수록 정확도가 증가하는 결과를 보였다.
후속연구
본 논문에서는 향후 연구 방향으로 유출 사고가 발생했을 경우 유출유의 확산을 기계학습을 이용하여 예측하는 연구를 진행하고자 한다. 유출 사고가 발생한 해역의 해류, 바람 등의 기상 데이터를 수집하고 신경망 및 통계 기법 기반의 기계학습 기법들을 이용해 유출유의 확산과 기상 데이터의 관계를 파악, 유출유 이동 및 확산을 예측하는 연구를 수행할 예정이며, 관련 연구로 데이터의 정확도 향상을 위한 데이터 보정 연구, 기계학습과 앙상블 기법을 이용한 유출유 예측 연구를 수행할 예정이다.
질의응답
핵심어
질문
논문에서 추출한 답변
서포트 벡터 머신이란?
서포트 벡터 머신은 주로 분류와 회귀 분석을 위해 사용되며, 자료 분석을 위한 지도 학습 모델이다. 서포트 벡터는 특정 공간에서 주어진 두 분류의 데이터를 구분 지을 수 있는 최적의 초평면(hyperplane)을 의미하며, 서포트 벡터 머신은 두 분류에서 가장 가까운 데이터를 하나씩 찾고 그 거리를 계산했을 때 가장 멀어질 수 있는 초평면을 찾는 것을 목표로 한다.
다층 퍼셉트론은 어떤 알고리즘을 이용하여 학습하는가?
일반적으로 3 ∼ 6 개 정도의 층을 두며, 이들은 각각 입력층, 은닉층, 출력층으로 구분된다. 기존의 선형 분리만 가능했던 단층 퍼셉트론의 문제점을 해결하고자 고안되었으며, 역전파(back-propagation) 알고리즘을 이용하여 학습한다.
유류유출 사고에 빠르고 효과적으로 대응하기 위해 어떤 것이 중요한가?
특히, 기상 현상은 인간의 생활과 밀접한 연관이 있으며, 발생할 수 있는 기상 및 재난 예측을 통해 인명, 재산 등의 피해로부터 예방 할 수 있게 해준다. 해상에서 발생할 수 있는 재난 중 하나인 유류유출 사고에 대해 빠르고 효과적으로 대응하기 위해서는 유출유의 이동과 주변 해역의 기상을 정확하게 예측하는 것이 중요하다. 본 논문에서는 분류 및 회귀 예측과 관련된 연구에서 준수한 성능 및 예측 가능성을 보여준 기계학습 기법으로 서포트 벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저함수 네트워크의 총 4 개의 기계학습 기법을 선별하였다.
참고문헌 (18)
McCloskey, D. N. "The art of forecasting: From ancient to modern times." Cato J. 12, pp.23-43, 1993.
Zschau, J., and Kuppers, A. N. eds. Early Warning Systems for Natural Disaster Reduction. Springer Science & Business Media, 2013.
Xie, P., and Arkin, P. A. "Analyses of global monthly precipitation using gauge observations, satellite estimates, and numerical model predictions." Journal of climate Vol. 9, No. 4, pp.840-858, 1996.
H. H. Lee, S. H. Chung, E. J. Choi, "A Case Study on Machine Learning Applications and Performance Improvement in Learning Algorithm", Journal of Digital Convergence, Vol. 14, No. 2, pp.245-258, 2016.
Y. D. Yun, Y. Wook. Yang, H. S. Ji, H. S. Lim, "Development of Smart Senior Classification Model based on Activity Profile Using Machine Learning Method", Journal of the Korea Convergence Society, Vol. 8, No. 1, pp.25-34, 2017.
Matkan, A. A., M. Hajeb, and Z. Azarakhsh. "Oil spill detection from SAR image using SVM based classification." ISPRS-International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences Vol. 1. No. 3, pp.55-60, 2013.
Tagliaferri, F., I. M. Viola, and R . G. J. Flay. "Wind direction forecasting with artificial neural networks and support vector machines." Ocean Engineering 97, pp.65-73, 2015.
Chang, C. C., and Lin, C. J. "LIBSVM: a library for support vector machines." ACM Transactions on Intelligent Systems and Technology (TIST) Vol. 2, No. 3, pp.27, 2011.
Zhao, P, Xia, J., Dai, Y., and He, J. "Wind speed prediction using support vector regression." 5th IEEE Conference on Industrial Electronics and Applications. IEEE, 2010.
Yoo, C. S., and Park, J. Y. "Combining radar and rain gauge observations utilizing Gaussian-process-based regression and support vector learning." Journal of Korean Institute of Intelligent Systems Vol. 18, No. 3, pp.297-305, 2008.
Petelin, D., Mlakar, P., Boznar, M. Z., Grasic, B. and Kocijan, J. "Ozone forecasting using Gaussian processes and perceptron neural networks", 16th International Conference on Harmonisation within Atmospheric Dispersion Modelling for Regulatory Purposes 2014.
Liu, J. N., Hu, Y., He, Y., Chan, P. W. and Lai, L. "Deep neural network modeling for big data weather forecasting." Information Granularity, Big Data, and Computational Intelligence. Springer International Publishing, pp.389-408, 2015.
Dalto, M., Vasak, M., Baotic, M., Matusko, J., and Horvath, K. "Neural-network-based ultra-short-term wind forecasting." European Wind Energy Association 2014 Annual Event 2014.
Yang, L., Tian, S., Yu, L., Ye, F., Qian, J., and Qian, Y. "Deep learning for extracting water body from Landsat imagery." International Journal of Innovative Computing, Information and Control Vol. 11, No. 6, 2015.
Baruque, B., Corchado, E., Mata, A., and Corchado, J. M. "forecasting solution to the oil spill problem based on a hybrid intelligent system." Information Sciences Vol. 180, No.10, pp.2029-2043, 2010.
Topouzelis, K., Karathanassi, V., Pavlakis, P., and Rokos, D. "Potentiality of feed -forward neural networks for classifying dark formations to oil spills and look-alikes." Geocarto International Vol. 24, No. 3, pp.179-191, 2009.
Ramedani, Z., Omid, M., Keyhani, A., Shamshirband, S. and Khoshnevisan, B. "Potential of radial basis function based support vector regression for global solar radiation prediction." Renewable and Sustainable Energy Reviews 39, pp.1005-1011, 2014.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.