GOCI 영상과 기계학습 기법을 이용한 Cochlodinium polykrikoides 적조 탐지 기법 연구 Study on Detection for Cochlodinium polykrikoides Red Tide using the GOCI image and Machine Learning Technique원문보기
본 연구에서는 적조 Cochlodinium Polykrikoide를 기계학습 방법과 정지궤도 해색위성 영상을 활용하여 탐지하는 방법을 제안한다. 기계학습 모형을 학습시키기 위해 GOCILevel2 자료를 활용하였으며, 국립수산과학원의 적조 속보 자료를 활용하였다. 기계학습 모델은 로지스틱 회귀모형, 의사결정나무 모형, 랜덤포래스트 모형을 사용하였다. 성능 평가 결과 기계학습을 사용하지 않은 전통적인 GOCI 영상 기반 적조 탐지 알고리즘(Son et al.,2012) (75%)과 비교해보았을 때 약 13~22%p (88~98%)의 정확도 향상을 확인할 수 있었다. 또한 기계학습 모형 간 탐지 성능을 비교 분석해본 결과 랜덤 포레스트 모형(98%)이 가장 높은 탐지 정확도를 보였다. 이러한 기계학습 기반 적조 탐지 알고리즘은 향후 적조를 조기에 탐지하고 그 이동과 확산을 추적 모니터링하는데 활용될 수 있을 것이라고 판단된다.
본 연구에서는 적조 Cochlodinium Polykrikoide를 기계학습 방법과 정지궤도 해색위성 영상을 활용하여 탐지하는 방법을 제안한다. 기계학습 모형을 학습시키기 위해 GOCI Level2 자료를 활용하였으며, 국립수산과학원의 적조 속보 자료를 활용하였다. 기계학습 모델은 로지스틱 회귀모형, 의사결정나무 모형, 랜덤포래스트 모형을 사용하였다. 성능 평가 결과 기계학습을 사용하지 않은 전통적인 GOCI 영상 기반 적조 탐지 알고리즘(Son et al.,2012) (75%)과 비교해보았을 때 약 13~22%p (88~98%)의 정확도 향상을 확인할 수 있었다. 또한 기계학습 모형 간 탐지 성능을 비교 분석해본 결과 랜덤 포레스트 모형(98%)이 가장 높은 탐지 정확도를 보였다. 이러한 기계학습 기반 적조 탐지 알고리즘은 향후 적조를 조기에 탐지하고 그 이동과 확산을 추적 모니터링하는데 활용될 수 있을 것이라고 판단된다.
In this study, we propose a method to detect red tide Cochlodinium Polykrikoide using by machine learning and geostationary marine satellite images. To learn the machine learning model, GOCI Level 2 data were used, and the red tide location data of the National Fisheries Research and Development Ins...
In this study, we propose a method to detect red tide Cochlodinium Polykrikoide using by machine learning and geostationary marine satellite images. To learn the machine learning model, GOCI Level 2 data were used, and the red tide location data of the National Fisheries Research and Development Institute was used. The machine learning model used logistic regression model, decision tree model, and random forest model. As a result of the performance evaluation, compared to the traditional GOCI image-based red tide detection algorithm without machine learning (Son et al., 2012) (75%), it was confirmed that the accuracy was improved by about 13~22%p (88~98%). In addition, as a result of comparing and analyzing the detection performance between machine learning models, the random forest model (98%) showed the highest detection accuracy.It is believed that this machine learning-based red tide detection algorithm can be used to detect red tide early in the future and track and monitor its movement and spread.
In this study, we propose a method to detect red tide Cochlodinium Polykrikoide using by machine learning and geostationary marine satellite images. To learn the machine learning model, GOCI Level 2 data were used, and the red tide location data of the National Fisheries Research and Development Institute was used. The machine learning model used logistic regression model, decision tree model, and random forest model. As a result of the performance evaluation, compared to the traditional GOCI image-based red tide detection algorithm without machine learning (Son et al., 2012) (75%), it was confirmed that the accuracy was improved by about 13~22%p (88~98%). In addition, as a result of comparing and analyzing the detection performance between machine learning models, the random forest model (98%) showed the highest detection accuracy.It is believed that this machine learning-based red tide detection algorithm can be used to detect red tide early in the future and track and monitor its movement and spread.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그러나 기계학습 기반 분류 알고리즘을 개발할 경우 학습 데이터셋의 불균형 데이터 문제가 발생할 수 있다[19]. 따라서 본 연구에서는 이런 문제를 해결하기 위해 회귀모형 또는 회귀모형이 포함된 모형들을 이용해서 적조를 탐지하는 방법을 제안했다.
목적은 일반적인 회귀 분석의 목표와 동일하게 종속 변수와 독립 변수간의 관계를 구체적인 함수로 나타내어 향후 예측 모델에 사용하는 것이다. 본 연구에서는 회귀모형을 포함한 후진 소거법 및 전진 선택법 및 단계적 선택법을 이용하여 기계학습 모형을 각각 만들었다.
본 연구에서는 C.polykrikoides를 기계학습 방법과 정지궤도 해색위성 영상을 활용하여 탐지하는 방법을 제안하고자 하며 기계학습 모형을 시키기 위해 GOCI Level 2 자료를 활용하였다. 그리고 국립수산과학원의 적조 속보 자료를 사용하였다.
본 연구에서는 위성 자료로 GOCI Level 2 자료를 활용하였으며 적조의 발생한 위치를 얻기 위해서 국립수산과학원의 적조 속보 자료를 사용해서 적조 탐지 기계학습 모형을 제안했다. 기계학습 모형으로 6가지 모형을 생성해서 확인했으며 (표 3) 성능 평가 결과 기계학습을 사용하지 않은 전통적인 GOCI 영상기반 적조 탐지 알고리즘(75%)과 비교해보았을 때 약 13~22%p (88~98%)의 정확도 향상을 확인할 수 있었다.
제안 방법
HABs 및 nonHABs 데이터에 imbalance 환경이 조성되어서 이 문제를 해소하기 위해 샘플 수가 적은적조는 오버샘플링 (HABs 2, 412개에서 100, 000개까지 )을 수행하였고 적조가 아닌 데이터는 언더샘플링(청수의 경우 906, 001개에서 50, 000개까지, 탁수의 경우 915, 372개에서 50, 000개까지)을 수행하여 데이터의 불균형 문제를 해결하였다. 이를 기반으로 학습 자료랑 검증 자료를 산출했다.
그리고 해양 환경은 세계 최초의 정지궤도위성으로 한반도 주변 2500km x 2500km 해양 수역을 500m x 500m의 공간 정확도로 관측하고, 정지궤도에서 하루 8번 한반도를 공전한다. 또한 적조 발생 위치를 얻기 위해 국립수산과학원에서 제공하는 적조속보 자료를 사용했다.
위치 정보로 활용하였다. 또한 적조가 발생한 해역의 GOCI Level 2 수출광량 분광 프로파일을 속성값으로 이용해서 진행하였다.
아. 랜덤 포레스트의 특징을 따라 ntree 값을 1로 선택해서 랜덤 포레스트 모델을 만들었다. 랜덤 포레스트 정확도가 가장 높은 0.
문제를 해결하였다. 이를 기반으로 학습 자료랑 검증 자료를 산출했다. 따라서 전체 200, 000개 데이터셋(HABs과 nonHABs 각각 100,000개)의 80%를 학습 자료로, 20%를 검증 자료 및 모형 평가 자료로 사용하였다.
대상 데이터
국립수산과학원의 적조 데이터를 바탕으로 적조가 발생한 가장 넓은 곳 또는 탁수가 가장 많다고 알려져 있는 남해 연안을 연구 지역으로 선택하였다(그림 1).
polykrikoides를 기계학습 방법과 정지궤도 해색위성 영상을 활용하여 탐지하는 방법을 제안하고자 하며 기계학습 모형을 시키기 위해 GOCI Level 2 자료를 활용하였다. 그리고 국립수산과학원의 적조 속보 자료를 사용하였다. 기계학습 모델은 회귀모형, 의사결정 나무 모형, 랜덤 포레스트 모형을 이용했다.
이를 기반으로 학습 자료랑 검증 자료를 산출했다. 따라서 전체 200, 000개 데이터셋(HABs과 nonHABs 각각 100,000개)의 80%를 학습 자료로, 20%를 검증 자료 및 모형 평가 자료로 사용하였다. 그 다음으로 기계학습 모형에 적용하였다.
그리고 해양 환경은 세계 최초의 정지궤도위성으로 한반도 주변 2500km x 2500km 해양 수역을 500m x 500m의 공간 정확도로 관측하고, 정지궤도에서 하루 8번 한반도를 공전한다. 또한 적조 발생 위치를 얻기 위해 국립수산과학원에서 제공하는 적조속보 자료를 사용했다.
본 연구에서는 국립수산과학원에서 제공하는 적조 발생 해역도를 지오레퍼런싱한 결과 자료 위도 및 경도값을 위치 정보로 활용하였다. 또한 적조가 발생한 해역의 GOCI Level 2 수출광량 분광 프로파일을 속성값으로 이용해서 진행하였다.
본 연구의 연구지역은 남해 연안으로 한국에서 적조가 많이 발생하고 해수가 case 2로 적조 탐지가 가장 어렵고 복잡하다. 연구 자료로 GOCI Level 2 자료와 국립 수산과학원의 적조 속보 자료를 사용하였다.
연구 자료는 GOCI (Geostationary Ocean Color Imager) 영상을 활용하였으며 GOCI는 가시광선 영역의 6개 채널과 근적외 영역의 2개 채널을 가지고 있다(표1). 그리고 해양 환경은 세계 최초의 정지궤도위성으로 한반도 주변 2500km x 2500km 해양 수역을 500m x 500m의 공간 정확도로 관측하고, 정지궤도에서 하루 8번 한반도를 공전한다.
어렵고 복잡하다. 연구 자료로 GOCI Level 2 자료와 국립 수산과학원의 적조 속보 자료를 사용하였다. 기계학습 모델은 회귀 모형, 의사결정나무 모형, 랜덤포레스트 모형을 이용했다.
데이터처리
그 다음으로 기계학습 모형에 적용하였다. 결과 정확도 평가는 오차행렬(Confusion Matrix, 표 2) 을 이용해서 확인하였다(그림 2).
이론/모형
그리고 국립수산과학원의 적조 속보 자료를 사용하였다. 기계학습 모델은 회귀모형, 의사결정 나무 모형, 랜덤 포레스트 모형을 이용했다.
그리고 국립수산과학원의 적조 속보 자료를 사용하였다. 기계학습 모델은 회귀모형, 의사결정 나무 모형, 랜덤 포레스트 모형을 이용했다.
본 연구에서는 분류 정확도를 평가하기 위해 오차 행렬(Confusion Matrix, 표 2)를 이용한 전체 정확도를 평가 측도로 사용하였다.
목적은 일반적인 회귀 분석의 목표와 동일하게 종속 변수와 독립 변수간의 관계를 구체적인 함수로 나타내어 향후 예측 모델에 사용하는 것이다. 본 연구에서는 회귀모형을 포함한 후진 소거법 및 전진 선택법 및 단계적 선택법을 이용하여 기계학습 모형을 각각 만들었다. 이런 회귀모형을 포함한 회귀 모형들은 설명 변수의 선택 방법에 따라 모형의 성능에 영향을 받을 수 있다.
기계학습 모델은 회귀 모형, 의사결정나무 모형, 랜덤포레스트 모형을 이용했다. 회귀 모형에서는 후진 소거법 및 전진 선택법 및 단계적 선택법을 이용하여 기계학습 모형을 각각 만들어보았다. (표 3) 계산을 R 스튜디오로 하였다.
성능/효과
전진 선택법을 활용한 회귀모형과 단계적 선택법을 활용한 회귀모형을 비교해 봤을 때 ACC 값은 큰 차이가 없었던 것을 확인할 수 있었고 TN과 FP 값들을 보면 전진 선택법을 활용한 회귀모형이 더 높게 나타났다. 그러나 FN과 TP 값은 단계적 선택법을 활용한 회귀모형의 결과가 상대적으로 높게 나타난 것을 확인할 수 있었다.
) 큰 차이를 보이지 않았다. 그러나 TN(18375, 1589, 1519, 18375, 17243) 및 FN(1594, 18228, 18298, 1594, 2708) 값들의 큰 차이를 보여주는 것을 확인할 수 있었다.
기계학습 모형을 제안했다. 기계학습 모형으로 6가지 모형을 생성해서 확인했으며 (표 3) 성능 평가 결과 기계학습을 사용하지 않은 전통적인 GOCI 영상기반 적조 탐지 알고리즘(75%)과 비교해보았을 때 약 13~22%p (88~98%)의 정확도 향상을 확인할 수 있었다. 또한 기계학습 모형 간 탐지 성능을 비교 분석해 본 결과 랜덤 포레스트 모형(98%)이 가장 높은 탐지정확도를 보였다.
8998이다. 두 모형은 큰 차이가 없는 것을 보여주지만 FN 값이 후진소거법을 활용한 회귀모형에 18298이라는 값이 나왔고 변수 선택법을 적용하지 않은 회귀모형 경우에는 1594로 훨씬 더 낮게 나타난 것을 확인할 수 있었다. 그러나 TN 값은 반대로 후진 소거법을 활용한 회귀모형은 변수선택법을 적용하지 않은 회귀모형보다 낮게 나타났다.
있다. 또한 COMS(Communication, Ocean and Meteorological Satellite)와 같은 정지궤도 위성을 이용할 경우 하루 8회 촬영을 통한 준 연속 모니터링이 가능하여 적조방재 능력을 향상시킬 수 있다.
기계학습 모형으로 6가지 모형을 생성해서 확인했으며 (표 3) 성능 평가 결과 기계학습을 사용하지 않은 전통적인 GOCI 영상기반 적조 탐지 알고리즘(75%)과 비교해보았을 때 약 13~22%p (88~98%)의 정확도 향상을 확인할 수 있었다. 또한 기계학습 모형 간 탐지 성능을 비교 분석해 본 결과 랜덤 포레스트 모형(98%)이 가장 높은 탐지정확도를 보였다. 회귀모형과 의사결정 나무 모형은 정확도가 대부분 88~90% 사이로 나타났다.
랜덤 포레스트의 특징을 따라 ntree 값을 1로 선택해서 랜덤 포레스트 모델을 만들었다. 랜덤 포레스트 정확도가 가장 높은 0.9863값을 보여준 것을 확인할 수 있었다.
가. 변수 선택법을 적용하지 않은 회귀모형과 전진 선택법을 활용한 회귀모형을 비교해 보았을 때, 정확도 결과가 크게 다르지 않은 것을 확인할 수 있었고 전진 선택법을 적용한 회귀 모형인 경우에 TP 및 FN의 관측값이 더 높고 변수 선택법을 적용하지 않은 회귀모형의 경우에는 FP 및 TN의 값이 높게 나타났다.
의사결정나무 모형의 경우 complexity parameter 값을 따라 결과의 효율적 인지를 확인할 수 있다. 본 논문에서는 0, 0.005, 0.01, 0.02, 0.03, 0.04, 0.05으로 계산해 봤을 때 CP=0.005 경우에 가장 타당한 결과를 보였다 (88.56%).
마. 전진 선택법을 활용한 회귀모형과 단계적 선택법을 활용한 회귀모형을 비교해 봤을 때 ACC 값은 큰 차이가 없었던 것을 확인할 수 있었고 TN과 FP 값들을 보면 전진 선택법을 활용한 회귀모형이 더 높게 나타났다. 그러나 FN과 TP 값은 단계적 선택법을 활용한 회귀모형의 결과가 상대적으로 높게 나타난 것을 확인할 수 있었다.
라. 전진 선택법을 활용한 회귀모형과 후진 소거법을 활용한 회귀모형의 ACC 값은 전진 선택법을 활용한 회귀모형의 경우에 0.9008 이었으며, 후진 소거법을 활용한 회귀모형의 경우에는 0.8998로 나타났다. 그러나 오차행렬값에는 큰 차이가 없는 것으로 나타났다.
표3에 나와 있는 결과를 비교해보면 랜덤 포레스트 모형을 빼고 나머지 모형들의 정확도가 전체적으로 유사하고(89, 90, 89, 88%) TP(17548, 17802, 17696, 17548, 18183, )및 FP 값도 (2501, 2381, 2487, 2501, 1866, ) 큰 차이를 보이지 않았다. 그러나 TN(18375, 1589, 1519, 18375, 17243) 및 FN(1594, 18228, 18298, 1594, 2708) 값들의 큰 차이를 보여주는 것을 확인할 수 있었다.
바. 후진 소거법을 활용한 회귀 모형과 단계적 선택법을 활용한 회귀모형을 비교해보면 ACC 값은 거의 동일하지만 TN과 FN 값들이 많은 차이를 보였다.
후속연구
이러한 기계학습 기반 적조 탐지 알고리즘은 향후 적조를 조기에 탐지하고 그 이동과 확산을 추적 모니터링에 활용될 수 있을 것이라고 판단된다.
참고문헌 (19)
D. Anderson, P. Anderson, V. Bricelj, J. Cullen, and J. Rensel, Monitoring and Management Strategies for Harmful Algal Blooms in Coastal Waters. Paris: Intergovernmental Oceanographic Commission Technical Series, 2001.
H. Kim, Harmful Algal Blooms in the Sea. Busan: Dasom, 2005.
Y. Yoon, Sea rebellion, Red tide. Paju: Jipmoondang, 2012.
Y. Kim, Y. Byun, Y. Huh, and Y. Yu, "Detection of Cochlodinium polykrikoides Red Tide Using MODIS Level 2 Data in Coastal Waters," Korean Society of Civil Engineers Journal of Civil Engineering, vol. 27, no. 4D, 2007, pp. 535-540.
S. Oh, J. Park, and H. Yoon, "Prediction of Red Tide Occurrence by using Oceanic and Atmospheric Data by Satellite," J. of the Korean institute of Electronic Communication Sciences, vol. 10, no. 2, 2015, pp. 311-318.
Y. Ahn, J. Moon, W. Seo, and H. Yoon, "Inherent Optical Properties of Red Tide Algal for Ocean Color Remote Sensing Application," J. of the Korean Society for Marine Environmental Engineering, vol. 12, no. 1, 2009, pp. 47-54.
R. Stumpf, M. Culver, P. Tester, M. Tomlinson, G. Kirkpatrick, B. Pederson, E. Truby, V. Ransibrahmanakul, and M. Soracco, "Monitoring Karenia brevis blooms in the Gulf of Mexico using satellite ocean color imagery and other data," Harmful Algjae, vol. 2, no. 2, 2003, pp. 147-160.
M. Tomlinson, R. Stumpf, V. Ransibrahmanakul, E. Truby, G. Kirkpatrick, B. Pederson, G. Vargo, and C. Heil, "Evaluation of the use of SeaWiFS imagery for detecting Karenia brevis harmful algal blooms in the eastern Gulf of Mexico," Remote Sensing of Environment, vol. 91, no. 3, 2004, pp. 293-303.
Y. Suh, L. Jang, N. Lee, and J. Ishizaka, "Feasibility of Red Tide Detection Around Korean Waters Using Satellite Remote Sensing," J. of Fisheries Science and Technology, vol. 7, no. 3, 2004, pp. 148-162.
J. Ishizaka, Y. Kitaura, Y. Touke, H. Sasaki, A. Tanaka, H. Murakami, T. Suzuki, K. Matsuoka, and H. Nakata, "Satellite Detection of Red Tide in Ariake Sound, 1998-2001," J. of Oceanography, vol. 62, no. 1, 2006, pp. 37-45.
Y. Son, Y. Kang, and J. Ryu, "Monitoring Red Tide in South Sea of Korea(SSK) Using the Geostationary Ocean Color Imager(GOCI)," Korean J. of Remote Sensing, vol. 26, no. 5, 2012, pp. 531-548.
Y. Ahn and P. Shanmugam, "Detecting the red tide algal bloom from satellite ocean color observations in optically complex Northeast-Asia Coastal waters," Remote Sensing of Environment, vol. 103, no. 4, 2006, pp. 419-437.
Y. Son, J. Ishizaka, J. Jeong, H. Kim, and T. Lee, "Cochlodinium polykrikoides red tide detection in the South Sea of Korea using spectral classification of MODIS data," Ocean Science Journal, vol. 46, no. 4, 2011, pp. 239-263.
S. Bak, H. Kim, D. Hwang, H. Yoon, and W. Seo, "Detection technique of Red tide Using GOCI Level 2 Data," Korean J. Remote Sensing, vol. 32, no. 6, 2016, pp. 673-679.
S. Bak, H. Kim, D. Hwang, S. Oh, and H. Yoon, "Red Tide Detection Technique by Using Multi-temporal GOCI Level 2 Data," Internation J. of Grid and Distributed Computing, vol. 10, no. 10, 2017, pp. 45-56.
H. Kim, S. Jang, and H. Yoon, "Utilization of Unmanned Aerial Vehicle(UAV) Image for Detection of Algal Bloom in Nakdong River," J. of the Korean institute of Electronic Communication Sciences, vol. 12, no. 3, 2017, pp. 457-464.
S. Bak and H. Yoon, "Analysis on optical property in the South Sea of Korea by using Satellite Image : Study of Case on red tide occurrence in August 2013," J. of the Korean institute of Electronic Communication Sciences, vol. 11, no. 7, 2016, pp. 723-728.
S. Bak, M. Jeong, D. Hwang, U. Enkhjargal, N. Kim, and H. Yoon, "Study on Cochlodinium polykrikoides Red tide Prediction using Deep Neural Network under Imbalanced Data," J. of the Korean Institute of Electronic Communication Sciences, vol. 14, no. 6, 2019, pp. 1161-1170.
S. Bak, H. Kim, D. Hwang, U. Enkhjargal, B. Kim, and H. Yoon, "Study on Detection Technique for Cochlodinium polykrikoides Red tide using Logistic Regression Model under Imbalanced Data," J. of the Korean Institute of Electronic Communication Sciences, vol. 13, no. 6, 2018, pp. 1353-1363.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.