본 연구에서는 미세먼지$PM_{10}$의 4가지 분류 등급인 '좋음, 보통, 나쁨, 매우 나쁨' 그리고 2가지 분류 등급인 '좋음 혹은 보통, 나쁨 혹은 매우 나쁨'을 예측하기 위해서 심층 신경망모형을 사용하였다. 2010년부터 2015년까지 국내 6개 대도시 지역에서 관측한 일별 미세먼지 데이터에 대하여 기존 분류기법인 신경망모형, 다항 로지스틱 회귀모형, Support Vector Machine, Random Forest을 적용했을 때에 비해서 심층 신경망모형의 정확도는 더 높아졌다.
본 연구에서는 미세먼지 $PM_{10}$의 4가지 분류 등급인 '좋음, 보통, 나쁨, 매우 나쁨' 그리고 2가지 분류 등급인 '좋음 혹은 보통, 나쁨 혹은 매우 나쁨'을 예측하기 위해서 심층 신경망모형을 사용하였다. 2010년부터 2015년까지 국내 6개 대도시 지역에서 관측한 일별 미세먼지 데이터에 대하여 기존 분류기법인 신경망모형, 다항 로지스틱 회귀모형, Support Vector Machine, Random Forest을 적용했을 때에 비해서 심층 신경망모형의 정확도는 더 높아졌다.
In this study, we applied a deep neural network model to predict four grades of fine dust $PM_{10}$, 'Good, Moderate, Bad, Very Bad' and two grades, 'Good or Moderate and Bad or Very Bad'. The deep neural network model and existing classification techniques (such as neural network model, ...
In this study, we applied a deep neural network model to predict four grades of fine dust $PM_{10}$, 'Good, Moderate, Bad, Very Bad' and two grades, 'Good or Moderate and Bad or Very Bad'. The deep neural network model and existing classification techniques (such as neural network model, multinomial logistic regression model, support vector machine, and random forest) were applied to fine dust daily data observed from 2010 to 2015 in six major metropolitan areas of Korea. Data analysis shows that the deep neural network model outperforms others in the sense of accuracy.
In this study, we applied a deep neural network model to predict four grades of fine dust $PM_{10}$, 'Good, Moderate, Bad, Very Bad' and two grades, 'Good or Moderate and Bad or Very Bad'. The deep neural network model and existing classification techniques (such as neural network model, multinomial logistic regression model, support vector machine, and random forest) were applied to fine dust daily data observed from 2010 to 2015 in six major metropolitan areas of Korea. Data analysis shows that the deep neural network model outperforms others in the sense of accuracy.
5는 오염물질이 대기 중에서 2차 반응하여 생성되는 2차 오염물질에 속한다. 미세먼지는 입자가 매우 작아 인체의 기관에서 걸러지지 못하고 몸속까지 스며들게 되는데 이때 몸속에서 세포와 염증반응이 발생하여 여러 질환 등이 유발될 수 있다. 2013년 10월 세계보건기구 산하 국제암연구소(International Agency for Research on Cancer)는 미세먼지를 인간에게 암을 일으키는 것으로 확인된 1군 발암물질로 분류할 정도로 미세먼지는 인체에 치명적인 대기오염물질이다.
미세먼지 예보에 있어 정확도를 적당히 높게 유지하면서 낮은 비율로 구성된 불균형 데이터에 대해서도 균형있는 예측 결과를 제공한다는 의미는?
그러나 신경망모형과 심층 신경망모형에 의한 이항 분류에서는 MCC의 절댓값을 최대로 하는 threshold 값을 사용하여 분류하게 되면 정확도를 적당히 높게 유지하면서 낮은 비율로 구성된 불균형 데이터에 대해서도 균형있는 예측 결과를 보여주었다. 이는 실제 미세먼지의 예보를 했을 때 나쁨 등급을 좋음 등급으로 분류할 때의 위험성을 줄이고 미세먼지 예방 차원에서 더 좋은 영향을 줄 수 있을 것이라 생각한다. 자료분석 결과를 종합하면 미세먼지의 4가지 등급 혹은 2가지 등급의 예측 정확도는 심층 신경망모형이 기존의 분류기법에 비해서 더 우수함을 보여주었다.
미세먼지의 예측을 위해 사용한 기법은?
미세먼지의 예측을 위하여 신경망모형, Support Vector Machine, 다항 로지스틱 회귀모형, RandomForest와 같은 기존의 주요 분류 기법 그리고 딥러닝기법에 속하는 심층 신경망모형을 사용하여 시뮬레이션을 통해 가장 성능이 좋은 활성함수와 모수를 찾고 최적화 기법을 통해 미세먼지의 4가지 등급응 예측하였을 때 비교적 높은 정확도를 보였지만 미세먼지가 나쁨(Bad) 혹은 매우 나쁨(Very Bad)인 등급에 대해서는 상대적으로 정확도가 낮았다. 그러나 신경망모형과 심층 신경망모형에 의한 이항 분류에서는 MCC의 절댓값을 최대로 하는 threshold 값을 사용하여 분류하게 되면 정확도를 적당히 높게 유지하면서 낮은 비율로 구성된 불균형 데이터에 대해서도 균형있는 예측 결과를 보여주었다.
참고문헌 (9)
Arno, C., Jessica, L., Erin, L., Viraj, P., and Anisha, A. (2015). Deep Learning with H2O (3rd ed), H2O.ai, Inc. California.
Koo, Y. S., Yun, H. Y., Kwon, H. Y., and Yu, S. H. (2010). A development of $PM_{10}$ forecasting system, Journal of Korean Society for Atmospheric Environment, 26, 666-682.
Korean Ministry of Environment (2016). If you know right now, it is seen. What on the earth is the ?ne dust? Korean Ministry of Environment.
Kwon, J. H., Lim, Y. J., and Oh, H. S. (2015). Particulate Matter prediction using Quantile boosting, The Korean Journal of Applied Statistics, 28, 83-92.
Lee, H. J. (2011). Analysis of $PM_{10}$ concentration using auto-regressive error model at Pyeongtaek City in Korea, Journal of Korean Society for Atmospheric Environment, 27, 358-366.
Lee, J. H., Kim, Y. M., and Kim, Y. K. (2017). Spatial panel analysis for PM2.5 concentrations in Korea, Journal of Korean Society for Atmospheric Environment, 27, 358-366.
Lee, W. S. and Baek, C. R. (2014). The sparse vector autoregressive model for $PM_{10}$ in Korea, Journal of the Korean Data and Information Science Society, 25, 807-817.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.