[논문]신경망 및 통계 기법 기반의 기계학습을 이용한 유류유출 및 기상 예측 연구 동향

김경도; 김용혁

doi:10.15207/jkcs.2017.8.10.001

문제 정의

본 논문에서는 기계학습을 이용하여 유류유출 및 기상을 예측하는 연구들에 대해 소개하였다. 유류유출 예측 연구는 위성사진과 같은 이미지 데이터와 주변 기상데이터를 이용하여 유류유출 발생 여부를 효과적으로 탐지 및 예측하였으나, 유류유출 발생 이후의 유출유의 확산 예측은 어려워 보였다.
본 논문에서는 예측과 기계학습을 이용해 자연에 심각한 피해를 입힐 수 있는 재해의 일종인 유류유출 사고를 대응하기 위한 연구들을 소개하며, 추가로 유출 상황에서 관련이 있는 바람, 해수 등의 기상을 예측하기 위한 최근 10 년간의 연구를 소개한다. 2 절에서는 본 논문에서 소개하는 유류유출 및 기상 예측 문제의 특징들을 유형별로 나누어 소개한다.
본 논문에서는 향후 연구 방향으로 유출 사고가 발생했을 경우 유출유의 확산을 기계학습을 이용하여 예측하는 연구를 진행하고자 한다. 유출 사고가 발생한 해역의 해류, 바람 등의 기상 데이터를 수집하고 신경망 및 통계 기법 기반의 기계학습 기법들을 이용해 유출유의 확산과 기상 데이터의 관계를 파악, 유출유 이동 및 확산을 예측하는 연구를 수행할 예정이며, 관련 연구로 데이터의 정확도 향상을 위한 데이터 보정 연구, 기계학습과 앙상블 기법을 이용한 유출유 예측 연구를 수행할 예정이다.
해역을 촬영한 위성 이미지 데이터를 사용하였으며, 물의 특성을 분석하여 이미지 상에서 강도, 색조, 채도 등으로 나누어 특징을 추출하는 방법으로 실험을 진행하였다. 이 연구에서는 자동인코더를 심층 신경망 구조로 구성한 누적 희소 자동인코더 모델을 제안하였다. 실험은 모델에 학습데이터 5만, 15만, 25만, 50만, 75만 개를 학습했을 때의 정확도를 비교하였으며, 서포트 벡터 머신, 인공신경망의 예측 결과와 비교하는 방식으로 진행하였다.
특히, 자연 현상 예측은 인간의 평소 생활뿐만 아니라 지진이나 홍수, 태풍 같은 재난으로 인해 발생할 수 있는 심각한 피해를 방지하기 위해 시대를 불문하고 동·식물의 모습, 별자리 관측 등의 방법부터 근래에는 여러 기계장치와 컴퓨터를 이용한 방법까지 다양한 방식으로 예측을 하고자 노력하였다[2].

제안 방법

Tagliaferri 등[8]은 인공신경망과 서포트 벡터 회귀를 이용해 풍향의 변화를 예측하는 연구를 진행하였다. 2013년 샌프란시스코에서 진행된 국제요트대회인 34회 아메리카 컵에서 수집한 데이터를 사용하였으며, 과거의 데이터로부터 특정 시점의 풍향을 예측하고 실제 측정값과 오차를 비교하는 방법으로 연구를 진행하였다. 실험은 1분 단위 예측과 2분 단위 예측으로 진행하였으며, 실험에 사용된 인공신경망은 매트랩으로 구현된 피드포워드(Feed- forward) 다층 퍼셉트론을 사용, 서포트 벡터 머신은 LIBSVM 라이브러리[9]를 사용하여 구현하였다.
본 논문에서 주제로 선정한 기계학습 기법은 서포트벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저 함수 네트워크의 4 가지다. 다양한 기계학습 기법들 중 유류유출 및 기상 예측 문제의 데이터 형태인 이미지와 시계열 데이터를 이용한 분류 및 회귀 분석에 적합한 기계학습 기법을 선정하였으며, 그 중 우수한 성능과 많은 연구에서 사용되는 기법으로 선정해 연구를 진행하였다. 최근 10 년간 진행된 예측과 관련된 연구를 기계학습 기법별로 정리한 결과는 다음의 [Table 1]과 같다.
유류유출 사고는 기름이 유출된 곳과 범위를 빠르게 파악하고 이동을 예측하여 확산을 방지하는 게 중요하다. 본 논문에서 조사한 유류유출 예측 문제의 유형으로는 첫 번째, 레이더, 위성사진 등의 이미지 데이터를 이용하여 기름이 유출된 부분을 기계학습을 통해 분류하는 문제, 두 번째, 평상시의 관측데이터와 유출 사고 발생 시의 관측 데이터를 수집하고 새로 관측된 데이터를 기계학습을 이용해 기존의 데이터와 비교하여 유류유출 여부를 판단하는 문제로 2 가지 유형의 문제가 있다.
2013년 샌프란시스코에서 진행된 국제요트대회인 34회 아메리카 컵에서 수집한 데이터를 사용하였으며, 과거의 데이터로부터 특정 시점의 풍향을 예측하고 실제 측정값과 오차를 비교하는 방법으로 연구를 진행하였다. 실험은 1분 단위 예측과 2분 단위 예측으로 진행하였으며, 실험에 사용된 인공신경망은 매트랩으로 구현된 피드포워드(Feed- forward) 다층 퍼셉트론을 사용, 서포트 벡터 머신은 LIBSVM 라이브러리[9]를 사용하여 구현하였다. 연구 결과, 두 방법 모두 1분 단위 예측이 2분 단위 예측에 비해 오차가 적었으며, 인공신경망의 경우 계층당 신경의 개수가 20여 개 정도가 되었을 때 효율이 가장 높았다.
테헤란 지역의 730 ㎢ 부분에서 관측된 온도, 습도 등의 기상 정보를 데이터로 사용하였으며, 서포트 벡터 머신에 회귀함수 추정문제를 풀기 위해 몇 가지 변수를 더한 알고리즘인 서포트 벡터 회귀를 주로 사용하면서 방사기저함수를 커널함수로 사용하는 SVR-RBF 모델을 통해 예측을 진행하였다. 실험은 SVR-RBF 모델과 기존에 사용하였던 인공신경망, 서포트 벡터 머신과 비교하였으며, 각 알고리즘을 학습한 이후 예측 값과 실제 값의 차이를 비교하는 방식으로 평가하였다. 실험 결과, SVR-RBF 모델이 타 알고리즘보다 중심 밀집도가 높았으며, 데이터 표본 수에 따라 정확도가 최대 93%까지 향상되는 결과를 보였다.
이 연구에서는 자동인코더를 심층 신경망 구조로 구성한 누적 희소 자동인코더 모델을 제안하였다. 실험은 모델에 학습데이터 5만, 15만, 25만, 50만, 75만 개를 학습했을 때의 정확도를 비교하였으며, 서포트 벡터 머신, 인공신경망의 예측 결과와 비교하는 방식으로 진행하였다. 실험 결과, 학습데이터 75만 개를 사용한 희소 자동인코더 모델이 가장 높은 정확도를 보였으며, 은닉층이 두 개일 때 최적의 결과를 보였다.
이전에 발생했던 유류유출 사고에서 관측한 데이터 및 위성 이미지를 데이터로 사용하였으며, 기존의 데이터와 새로 측정된 데이터 및 이미지를 이용하여 유류유출 여부를 판단하는 사례기반추론 방법과 방사기저함수에 기존에 저장된 데이터를 학습시켜 새로운 타입의 데이터를 추출하고 추출된 데이터들을 평가 및 선별하여 다시 저장된 데이터를 업데이트하는 방법을 이용하였다. 실험은 방사기저함수 모델과 사례기반추론 모델, 사례기반추론에 방사기저함수를 이용한 데이터 보정이 추가된 모델의 예측 결과를 비교하는 방식으로 진행되었다. 실험 결과, 방사기저함수를 단독으로 사용한 경우보다 데이터 보정을 위한 방안으로 사용 할 경우 더 높은 정확도를 보였다.
크로아티아의 스플리트, 시베니크, 크닌 세 곳에서 측정한 풍향과 풍속 데이터를 이용하였으며, 동쪽 방향의 벡터와 북쪽 방향의 벡터로 나누어 사용했다. 실험은 입력 변수 선택을 하지 않고 학습한 신경망과 입력 변수 선택을 이용하여 학습한 신경망으로 나누어 예측을 진행하였으며, 입력 변수 선택은 신경망 학습 시 사용되는 데이터 중 중복되는 값을 배제하여 효율적이고 빠르게 학습시키기 위한 방법이다. 예측 결과는 얕은 신경망(shallow neural network)의 예측 값과 함께 평균 절대 오차(MAE)를 통해 비교하였다.
Topouzelis 등[17]은 방사기저함수와 다층 퍼셉트론을 이용한 유류유출 예측 연구를 진행하였다. 위성으로 촬영한 합성개구레이더 이미지를 전처리를 통해 2,000 개의 학습데이터로 나누어 사용하였으며, 이미지에 나온 바다의 어두운 부분, 빛의 산란을 이용해 유류유출을 판단 할 수 있다는 점을 이용하여 학습영역을 유출영역과 비유출영역, 유출처럼 보이는 영역으로 나누어 학습을 진행하였다. 실험 결과, 다층 퍼셉트론은 두 종류의 입력만 받으면 예측 정확도가 많이 떨어졌으며, 입력의 가짓수를 늘리면 좋은 예측 정확도를 보이지만 시간이 오래 걸렸다.
Matkan 등[7]은 서포트 벡터 머신을 이용해 유류유출을 탐지하는 연구를 진행하였다. 위성으로 촬영한 합성개구레이더(SAR) 이미지를 데이터로 사용하였으며, 이미지를 HH(horizontal- horizontal) 채널 이미지와 VV(vertical-vertical) 채널 이미지로 추출하여 파울리,크로게이거, 프리먼의 총 3 가지 방법으로 분해하여 특성을 분석하는 방법으로 연구를 진행하였다. 이미지를 분해하면 후방 산란(back scattering)을 일으키는 물질의 표면, 부피와 이면각(dihedral) 산란 같은 물리적 특성과 연관 지을 수 있다는 점을 이용하였으며, 제안한 알고리즘을 통해 산란도, 가간섭성(coherency) 등의 수치를 도출하여 분류하였다.
강우량 측정에 있어서 레이더는 넓은 범위의 관측이 가능하나 데이터의 정확도가 낮으며, 강우계는 정밀한 측정이 가능하나 수집 위치가 제한적이라 관측 데이터가 상대적으로 적다. 이 연구에서는 강우계의 적은 데이터를 보충하기 위해 함수 근사기법을 사용하였으며, 도출된 강우계 관측 데이터에 가우시안 프로세스 기반 조건부 병합 전략을 이용해 레이더 관측 데이터와 크리깅 알고리즘을 적용하여 데이터를 보정하였다. 실험에는 한국의 강원, 경북, 충북 지역의 레이더 강우 데이터와 건설교통부(MOCT)에 의해 측정된 지상강우량 데이터를 이용하였으며, 실측값과 예측값을 평균 절대 오차를 이용해 비교하였다.
오존은 농도가 특정 수치보다 높아질수록 인간과 식물에게 해를 끼치게 되며, 이를 방지하기 위한 농도 예측이 필요하다. 이 연구에서는 진화 가우시안 프로세스와 다층 퍼셉트론 신경망에 바람, 온도, 기압, 먼지, 오염 가스 등의 오존에 영향을 미칠 수 있는 데이터들을 학습시켜 오존의 농도를 예측하는 방법을 이용하였다. 진화 가우시안 프로세스는 기존의 가우시안 프로세스에서 학습 데이터의 양이 많아질수록 계산 복잡도가 커지는 문제를 해결하기 위해 활성 집합이라는 학습 데이터의 수를 조절하는 방법을 적용한 기법이다.
위성으로 촬영한 합성개구레이더(SAR) 이미지를 데이터로 사용하였으며, 이미지를 HH(horizontal- horizontal) 채널 이미지와 VV(vertical-vertical) 채널 이미지로 추출하여 파울리,크로게이거, 프리먼의 총 3 가지 방법으로 분해하여 특성을 분석하는 방법으로 연구를 진행하였다. 이미지를 분해하면 후방 산란(back scattering)을 일으키는 물질의 표면, 부피와 이면각(dihedral) 산란 같은 물리적 특성과 연관 지을 수 있다는 점을 이용하였으며, 제안한 알고리즘을 통해 산란도, 가간섭성(coherency) 등의 수치를 도출하여 분류하였다. 실험 결과, HH 채널을 이용한 분류보다 VV채널을 이용한 분류가 더 좋은 결과를 보였으며, 파울리, 크로게이거, 프리먼 분해를 통한 분류에서는 크로게이거 분해를 이용한 분류가 높은 정확도를 보였다.
Baruque 등[16]은 방사기저함수와 사례기반추론 모델을 이용한 유류유출 예측 연구를 진행하였다. 이전에 발생했던 유류유출 사고에서 관측한 데이터 및 위성 이미지를 데이터로 사용하였으며, 기존의 데이터와 새로 측정된 데이터 및 이미지를 이용하여 유류유출 여부를 판단하는 사례기반추론 방법과 방사기저함수에 기존에 저장된 데이터를 학습시켜 새로운 타입의 데이터를 추출하고 추출된 데이터들을 평가 및 선별하여 다시 저장된 데이터를 업데이트하는 방법을 이용하였다. 실험은 방사기저함수 모델과 사례기반추론 모델, 사례기반추론에 방사기저함수를 이용한 데이터 보정이 추가된 모델의 예측 결과를 비교하는 방식으로 진행되었다.
Ramedani 등[18]은 서포트 벡터 머신-방사기저함수(SVM-RBF)를 이용하여 일사량을 예측하는 연구를 진행하였다. 테헤란 지역의 730 ㎢ 부분에서 관측된 온도, 습도 등의 기상 정보를 데이터로 사용하였으며, 서포트 벡터 머신에 회귀함수 추정문제를 풀기 위해 몇 가지 변수를 더한 알고리즘인 서포트 벡터 회귀를 주로 사용하면서 방사기저함수를 커널함수로 사용하는 SVR-RBF 모델을 통해 예측을 진행하였다. 실험은 SVR-RBF 모델과 기존에 사용하였던 인공신경망, 서포트 벡터 머신과 비교하였으며, 각 알고리즘을 학습한 이후 예측 값과 실제 값의 차이를 비교하는 방식으로 평가하였다.
Yang 등[15]은 심층 신경망을 이용하여 수역 인식 및 추출 방법에 대한 연구를 진행하였다. 해역을 촬영한 위성 이미지 데이터를 사용하였으며, 물의 특성을 분석하여 이미지 상에서 강도, 색조, 채도 등으로 나누어 특징을 추출하는 방법으로 실험을 진행하였다. 이 연구에서는 자동인코더를 심층 신경망 구조로 구성한 누적 희소 자동인코더 모델을 제안하였다.

대상 데이터

본 논문에서 주제로 선정한 기계학습 기법은 서포트벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저 함수 네트워크의 4 가지다. 다양한 기계학습 기법들 중 유류유출 및 기상 예측 문제의 데이터 형태인 이미지와 시계열 데이터를 이용한 분류 및 회귀 분석에 적합한 기계학습 기법을 선정하였으며, 그 중 우수한 성능과 많은 연구에서 사용되는 기법으로 선정해 연구를 진행하였다.
이 연구에서는 일정 시간 동안 수집한 풍속 데이터를 서포트 벡터 회귀 모델과 역전파 신경망에 학습시키고 특정 시점의 풍속을 예측하여 실제 데이터와의 차이를 평균 제곱 오차와 평균 절대 오차를 이용하여 비교하였다. 실험에는 스웨덴 KTH 풍력 발전소에서 35일 동안 매 10분의 평균으로 측정한 5,040 개의 데이터를 사용하였으며, 4,500 개의 데이터를 학습에 사용하고, 540 개의 데이터를 테스트에 사용하였다. 실험 결과, 서포트 벡터 회귀 모델이 역전파 신경망보다 더 작은 편차를 보였으며, 정확도 또한 더 높은 결과를 보여주었다.
진화 가우시안 프로세스는 기존의 가우시안 프로세스에서 학습 데이터의 양이 많아질수록 계산 복잡도가 커지는 문제를 해결하기 위해 활성 집합이라는 학습 데이터의 수를 조절하는 방법을 적용한 기법이다. 실험에는 슬로베니아의 노바 고리차에 설치된 자동 공기 오염 측정국(ANAS)에서 측정된 바람, 온도, 상대 습도, 기압, 먼지, 오염 가스 등의 데이터를 사용하였으며, 총 556 개의 데이터 중 488 개를 학습데이터로 사용하고, 68 개의 데이터를 테스트 데이터로 사용하였다. 실험 결과, 진화 가우시안 프로세스의 활성 집합의 크기가 100, 150 개일 경우 다층 퍼셉트론과 비슷한 결과를 보였으며, 특히 200 개 일 경우 정확도 95% 정도로 경보 시스템에 사용할 수 있을 만큼 높은 정확도를 보였다.
이 연구에서는 강우계의 적은 데이터를 보충하기 위해 함수 근사기법을 사용하였으며, 도출된 강우계 관측 데이터에 가우시안 프로세스 기반 조건부 병합 전략을 이용해 레이더 관측 데이터와 크리깅 알고리즘을 적용하여 데이터를 보정하였다. 실험에는 한국의 강원, 경북, 충북 지역의 레이더 강우 데이터와 건설교통부(MOCT)에 의해 측정된 지상강우량 데이터를 이용하였으며, 실측값과 예측값을 평균 절대 오차를 이용해 비교하였다. 실험 결과, 조건부 병합 전략을 사용할 경우 약 5%의 정확도가 향상되었다.
홍콩 기상청에서 제공받은 30 년간의 기온, 이슬점, 평균 해면 기압, 풍향 및 풍속 등의 데이터를 사용하였으며, 심층 신경망 학습을 이용하여 예측 방법을 사용하였다. 실험은 약 26만 개의 데이터 중에서 23만 개를 학습 데이터로 사용하고, 2만 6천 개의 데이터를 테스트 데이터로 사용하였다. 예측 결과를 비교하기 위해 기본적인 서포트 벡터 회귀와 서포트 벡터 회귀 계층을 최상위 계층으로 가지는 심층 신경망 모델을 사용하였으며, 예측의 정확도 평가를 위해서 정규 평균 제곱오차, 방향 대칭성, 결정계수를 사용하여 비교하였다.
Đalto 등[14]은 심층 신경망을 이용하여 바람을 예측하는 연구를 진행하였다. 크로아티아의 스플리트, 시베니크, 크닌 세 곳에서 측정한 풍향과 풍속 데이터를 이용하였으며, 동쪽 방향의 벡터와 북쪽 방향의 벡터로 나누어 사용했다. 실험은 입력 변수 선택을 하지 않고 학습한 신경망과 입력 변수 선택을 이용하여 학습한 신경망으로 나누어 예측을 진행하였으며, 입력 변수 선택은 신경망 학습 시 사용되는 데이터 중 중복되는 값을 배제하여 효율적이고 빠르게 학습시키기 위한 방법이다.
Liu 등[13]은 심층 신경망과 서포트 벡터 머신 알고리즘을 이용하여 날씨 예측 연구를 진행하였다. 홍콩 기상청에서 제공받은 30 년간의 기온, 이슬점, 평균 해면 기압, 풍향 및 풍속 등의 데이터를 사용하였으며, 심층 신경망 학습을 이용하여 예측 방법을 사용하였다. 실험은 약 26만 개의 데이터 중에서 23만 개를 학습 데이터로 사용하고, 2만 6천 개의 데이터를 테스트 데이터로 사용하였다.

데이터처리

실험은 입력 변수 선택을 하지 않고 학습한 신경망과 입력 변수 선택을 이용하여 학습한 신경망으로 나누어 예측을 진행하였으며, 입력 변수 선택은 신경망 학습 시 사용되는 데이터 중 중복되는 값을 배제하여 효율적이고 빠르게 학습시키기 위한 방법이다. 예측 결과는 얕은 신경망(shallow neural network)의 예측 값과 함께 평균 절대 오차(MAE)를 통해 비교하였다. 실험 결과, 얕은 신경망보다 심층 신경망을 이용한 예측이 더 높은 정확도를 보였으며, 입력 변수 선택을 사용하지 않은 경우보다 입력 변수 선택을 사용한 심층 신경망이 더 높은 예측 정확도를 보였다.
실험은 약 26만 개의 데이터 중에서 23만 개를 학습 데이터로 사용하고, 2만 6천 개의 데이터를 테스트 데이터로 사용하였다. 예측 결과를 비교하기 위해 기본적인 서포트 벡터 회귀와 서포트 벡터 회귀 계층을 최상위 계층으로 가지는 심층 신경망 모델을 사용하였으며, 예측의 정확도 평가를 위해서 정규 평균 제곱오차, 방향 대칭성, 결정계수를 사용하여 비교하였다. 실험 결과, 기온과 이슬점 예측에서 두 예측 모델 모두 매우 높은 정확도를 보였으며, 풍속 예측에서도 높은 정확도를 보여주었다.
풍력 발전의 효율은 풍력 조건에 따라 결정되며, 풍속 및 풍향은 지형 및 장애물로 인해 자주 변화한다. 이 연구에서는 일정 시간 동안 수집한 풍속 데이터를 서포트 벡터 회귀 모델과 역전파 신경망에 학습시키고 특정 시점의 풍속을 예측하여 실제 데이터와의 차이를 평균 제곱 오차와 평균 절대 오차를 이용하여 비교하였다. 실험에는 스웨덴 KTH 풍력 발전소에서 35일 동안 매 10분의 평균으로 측정한 5,040 개의 데이터를 사용하였으며, 4,500 개의 데이터를 학습에 사용하고, 540 개의 데이터를 테스트에 사용하였다.

이론/모형

일반적으로 3 ∼ 6 개 정도의 층을 두며, 이들은 각각 입력층, 은닉층, 출력층으로 구분된다. 기존의 선형 분리만 가능했던 단층 퍼셉트론의 문제점을 해결하고자 고안되었으며, 역전파(back-propagation) 알고리즘을 이용하여 학습한다.
방사기저함수 네트워크 구조는 다층 퍼셉트론과 비슷한 구조를 가지며, 입력층, 하나의 은닉층, 출력층으로 구분된다. 은닉층에는 확률가우시안 함수가 적용되어 있으며, 역전파 알고리즘을 이용하여 학습한다.

성능/효과

연구 결과, 두 방법 모두 1분 단위 예측이 2분 단위 예측에 비해 오차가 적었으며, 인공신경망의 경우 계층당 신경의 개수가 20여 개 정도가 되었을 때 효율이 가장 높았다. 100분의 데이터를 이용해 테스트한 결과 인공신경망의 경 경우 75%의 정확도를 보여줬으며, 서포트 벡터 머신의 경우 85%의 정확도를 보여주었다.
유류유출 예측 연구는 위성사진과 같은 이미지 데이터와 주변 기상데이터를 이용하여 유류유출 발생 여부를 효과적으로 탐지 및 예측하였으나, 유류유출 발생 이후의 유출유의 확산 예측은 어려워 보였다. 기상 예측 연구는 바람, 오존, 강우량 등의 기상 관련 요소를 관측한 데이터와 다양한 기계학습 기법들을 이용하여 효과적으로 예측하였으며 정확도 또한 높은 결과를 보여주었다. 이러한 연구 결과 들을 종합해보면 유류유출 및 기상 관련 요소들을 기계학습을 이용해 단기간의 변화를 효과적으로 예측이 가능하다는 것을 보여주었으며, 다양한 시계열 데이터를 이용한 예측을 진행할 때, 기계학습 적용을 통한 효과적인 예측 가능성을 보여주었다.
실험 결과, 다층 퍼셉트론은 두 종류의 입력만 받으면 예측 정확도가 많이 떨어졌으며, 입력의 가짓수를 늘리면 좋은 예측 정확도를 보이지만 시간이 오래 걸렸다. 방사기저함수는 프로토타입 벡터값에 따라 결과가 많이 달라졌으며 비교적 낮은 정확도를 보였지만, 학습시간을 충분히 주게 되면 모델의 최적화를 통해 예측 속도 및 정확도가 향상되는 것을 보였다.
이미지를 분해하면 후방 산란(back scattering)을 일으키는 물질의 표면, 부피와 이면각(dihedral) 산란 같은 물리적 특성과 연관 지을 수 있다는 점을 이용하였으며, 제안한 알고리즘을 통해 산란도, 가간섭성(coherency) 등의 수치를 도출하여 분류하였다. 실험 결과, HH 채널을 이용한 분류보다 VV채널을 이용한 분류가 더 좋은 결과를 보였으며, 파울리, 크로게이거, 프리먼 분해를 통한 분류에서는 크로게이거 분해를 이용한 분류가 높은 정확도를 보였다.
실험은 SVR-RBF 모델과 기존에 사용하였던 인공신경망, 서포트 벡터 머신과 비교하였으며, 각 알고리즘을 학습한 이후 예측 값과 실제 값의 차이를 비교하는 방식으로 평가하였다. 실험 결과, SVR-RBF 모델이 타 알고리즘보다 중심 밀집도가 높았으며, 데이터 표본 수에 따라 정확도가 최대 93%까지 향상되는 결과를 보였다.
예측 결과를 비교하기 위해 기본적인 서포트 벡터 회귀와 서포트 벡터 회귀 계층을 최상위 계층으로 가지는 심층 신경망 모델을 사용하였으며, 예측의 정확도 평가를 위해서 정규 평균 제곱오차, 방향 대칭성, 결정계수를 사용하여 비교하였다. 실험 결과, 기온과 이슬점 예측에서 두 예측 모델 모두 매우 높은 정확도를 보였으며, 풍속 예측에서도 높은 정확도를 보여주었다. 평균 해면 기압 예측의 경우, 결과가 좋지 않았으나 서포트 벡터 회귀모델보다 심층 신경망 모델이 더 좋은 결과를 보였다.
위성으로 촬영한 합성개구레이더 이미지를 전처리를 통해 2,000 개의 학습데이터로 나누어 사용하였으며, 이미지에 나온 바다의 어두운 부분, 빛의 산란을 이용해 유류유출을 판단 할 수 있다는 점을 이용하여 학습영역을 유출영역과 비유출영역, 유출처럼 보이는 영역으로 나누어 학습을 진행하였다. 실험 결과, 다층 퍼셉트론은 두 종류의 입력만 받으면 예측 정확도가 많이 떨어졌으며, 입력의 가짓수를 늘리면 좋은 예측 정확도를 보이지만 시간이 오래 걸렸다. 방사기저함수는 프로토타입 벡터값에 따라 결과가 많이 달라졌으며 비교적 낮은 정확도를 보였지만, 학습시간을 충분히 주게 되면 모델의 최적화를 통해 예측 속도 및 정확도가 향상되는 것을 보였다.
실험은 방사기저함수 모델과 사례기반추론 모델, 사례기반추론에 방사기저함수를 이용한 데이터 보정이 추가된 모델의 예측 결과를 비교하는 방식으로 진행되었다. 실험 결과, 방사기저함수를 단독으로 사용한 경우보다 데이터 보정을 위한 방안으로 사용 할 경우 더 높은 정확도를 보였다.
실험에는 스웨덴 KTH 풍력 발전소에서 35일 동안 매 10분의 평균으로 측정한 5,040 개의 데이터를 사용하였으며, 4,500 개의 데이터를 학습에 사용하고, 540 개의 데이터를 테스트에 사용하였다. 실험 결과, 서포트 벡터 회귀 모델이 역전파 신경망보다 더 작은 편차를 보였으며, 정확도 또한 더 높은 결과를 보여주었다.
예측 결과는 얕은 신경망(shallow neural network)의 예측 값과 함께 평균 절대 오차(MAE)를 통해 비교하였다. 실험 결과, 얕은 신경망보다 심층 신경망을 이용한 예측이 더 높은 정확도를 보였으며, 입력 변수 선택을 사용하지 않은 경우보다 입력 변수 선택을 사용한 심층 신경망이 더 높은 예측 정확도를 보였다.
실험에는 한국의 강원, 경북, 충북 지역의 레이더 강우 데이터와 건설교통부(MOCT)에 의해 측정된 지상강우량 데이터를 이용하였으며, 실측값과 예측값을 평균 절대 오차를 이용해 비교하였다. 실험 결과, 조건부 병합 전략을 사용할 경우 약 5%의 정확도가 향상되었다.
실험에는 슬로베니아의 노바 고리차에 설치된 자동 공기 오염 측정국(ANAS)에서 측정된 바람, 온도, 상대 습도, 기압, 먼지, 오염 가스 등의 데이터를 사용하였으며, 총 556 개의 데이터 중 488 개를 학습데이터로 사용하고, 68 개의 데이터를 테스트 데이터로 사용하였다. 실험 결과, 진화 가우시안 프로세스의 활성 집합의 크기가 100, 150 개일 경우 다층 퍼셉트론과 비슷한 결과를 보였으며, 특히 200 개 일 경우 정확도 95% 정도로 경보 시스템에 사용할 수 있을 만큼 높은 정확도를 보였다.
실험은 모델에 학습데이터 5만, 15만, 25만, 50만, 75만 개를 학습했을 때의 정확도를 비교하였으며, 서포트 벡터 머신, 인공신경망의 예측 결과와 비교하는 방식으로 진행하였다. 실험 결과, 학습데이터 75만 개를 사용한 희소 자동인코더 모델이 가장 높은 정확도를 보였으며, 은닉층이 두 개일 때 최적의 결과를 보였다. 학습데이터의 크기가 클수록 정확도가 증가하는 결과를 보였다.
실험은 1분 단위 예측과 2분 단위 예측으로 진행하였으며, 실험에 사용된 인공신경망은 매트랩으로 구현된 피드포워드(Feed- forward) 다층 퍼셉트론을 사용, 서포트 벡터 머신은 LIBSVM 라이브러리[9]를 사용하여 구현하였다. 연구 결과, 두 방법 모두 1분 단위 예측이 2분 단위 예측에 비해 오차가 적었으며, 인공신경망의 경우 계층당 신경의 개수가 20여 개 정도가 되었을 때 효율이 가장 높았다. 100분의 데이터를 이용해 테스트한 결과 인공신경망의 경 경우 75%의 정확도를 보여줬으며, 서포트 벡터 머신의 경우 85%의 정확도를 보여주었다.
기상 예측 연구는 바람, 오존, 강우량 등의 기상 관련 요소를 관측한 데이터와 다양한 기계학습 기법들을 이용하여 효과적으로 예측하였으며 정확도 또한 높은 결과를 보여주었다. 이러한 연구 결과 들을 종합해보면 유류유출 및 기상 관련 요소들을 기계학습을 이용해 단기간의 변화를 효과적으로 예측이 가능하다는 것을 보여주었으며, 다양한 시계열 데이터를 이용한 예측을 진행할 때, 기계학습 적용을 통한 효과적인 예측 가능성을 보여주었다.
실험 결과, 기온과 이슬점 예측에서 두 예측 모델 모두 매우 높은 정확도를 보였으며, 풍속 예측에서도 높은 정확도를 보여주었다. 평균 해면 기압 예측의 경우, 결과가 좋지 않았으나 서포트 벡터 회귀모델보다 심층 신경망 모델이 더 좋은 결과를 보였다.
실험 결과, 학습데이터 75만 개를 사용한 희소 자동인코더 모델이 가장 높은 정확도를 보였으며, 은닉층이 두 개일 때 최적의 결과를 보였다. 학습데이터의 크기가 클수록 정확도가 증가하는 결과를 보였다.

후속연구

본 논문에서는 향후 연구 방향으로 유출 사고가 발생했을 경우 유출유의 확산을 기계학습을 이용하여 예측하는 연구를 진행하고자 한다. 유출 사고가 발생한 해역의 해류, 바람 등의 기상 데이터를 수집하고 신경망 및 통계 기법 기반의 기계학습 기법들을 이용해 유출유의 확산과 기상 데이터의 관계를 파악, 유출유 이동 및 확산을 예측하는 연구를 수행할 예정이며, 관련 연구로 데이터의 정확도 향상을 위한 데이터 보정 연구, 기계학습과 앙상블 기법을 이용한 유출유 예측 연구를 수행할 예정이다.

핵심어	질문	논문에서 추출한 답변
	서포트 벡터 머신이란?	서포트 벡터 머신은 주로 분류와 회귀 분석을 위해 사용되며, 자료 분석을 위한 지도 학습 모델이다. 서포트 벡터는 특정 공간에서 주어진 두 분류의 데이터를 구분 지을 수 있는 최적의 초평면(hyperplane)을 의미하며, 서포트 벡터 머신은 두 분류에서 가장 가까운 데이터를 하나씩 찾고 그 거리를 계산했을 때 가장 멀어질 수 있는 초평면을 찾는 것을 목표로 한다.
	다층 퍼셉트론은 어떤 알고리즘을 이용하여 학습하는가?	일반적으로 3 ∼ 6 개 정도의 층을 두며, 이들은 각각 입력층, 은닉층, 출력층으로 구분된다. 기존의 선형 분리만 가능했던 단층 퍼셉트론의 문제점을 해결하고자 고안되었으며, 역전파(back-propagation) 알고리즘을 이용하여 학습한다.
	유류유출 사고에 빠르고 효과적으로 대응하기 위해 어떤 것이 중요한가?	특히, 기상 현상은 인간의 생활과 밀접한 연관이 있으며, 발생할 수 있는 기상 및 재난 예측을 통해 인명, 재산 등의 피해로부터 예방 할 수 있게 해준다. 해상에서 발생할 수 있는 재난 중 하나인 유류유출 사고에 대해 빠르고 효과적으로 대응하기 위해서는 유출유의 이동과 주변 해역의 기상을 정확하게 예측하는 것이 중요하다. 본 논문에서는 분류 및 회귀 예측과 관련된 연구에서 준수한 성능 및 예측 가능성을 보여준 기계학습 기법으로 서포트 벡터 머신, 가우시안 프로세스, 다층 퍼셉트론, 방사기저함수 네트워크의 총 4 개의 기계학습 기법을 선별하였다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

신경망 및 통계 기법 기반의 기계학습을 이용한 유류유출 및 기상 예측 연구 동향
A Survey on Oil Spill and Weather Forecast Using Machine Learning Based on Neural Networks and Statistical Methods 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (18)

이 논문을 인용한 문헌

저자의 다른 논문 :

연구과제 타임라인

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

연관된 기능

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

신경망 및 통계 기법 기반의 기계학습을 이용한 유류유출 및 기상 예측 연구 동향 A Survey on Oil Spill and Weather Forecast Using Machine Learning Based on Neural Networks and Statistical Methods 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (18)

이 논문을 인용한 문헌

저자의 다른 논문 :

김경도 (2) 김용혁 (27)

연구과제 타임라인

전체(0) 논문(0) 특허(0) 보고서(0)

전체(0) 논문(0) 특허(0) 보고서(0)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

연관된 기능

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

신경망 및 통계 기법 기반의 기계학습을 이용한 유류유출 및 기상 예측 연구 동향
A Survey on Oil Spill and Weather Forecast Using Machine Learning Based on Neural Networks and Statistical Methods 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper