최근 미세먼지 수치가 급격히 상승함에 따라 이에 대한 관심도가 굉장히 높아지고 있다. 미세먼지의 노출은 호흡기 및 심혈관계 질환의 발생과 관련이 있으며, 사망률도 증가시키는 것으로 보고되고 있다. 뿐만 아니라, 산업현장에서도 미세먼지에 대한 피해가 속출한다. 그러나 현대인의 삶에서 미세먼지 노출은 불가피하다. 그러므로 미세먼지를 예측하여, 이에 대한 노출을 최소화하는 것이 건강 및 산업 피해축소에 가장 효율적인 방법일 것이다. 기존의 미세먼지 예측 모델은 농도 수치가 아닌 미세먼지의 농도 범위에 따라 좋음, 보통, 나쁨, 매우 나쁨으로만 나누어 예보하고 있다. 본 논문은 기존의 실제 기상 및 대기 질 데이터를 이용, 기계학습 알고리즘인 Artificial Neural Network (ANN)알고리즘과 K-Nearest Neighbor (K-NN)알고리즘을 상호 응용하여 미세먼지 수치 (PM 10)를 예측하고자 하였다.
최근 미세먼지 수치가 급격히 상승함에 따라 이에 대한 관심도가 굉장히 높아지고 있다. 미세먼지의 노출은 호흡기 및 심혈관계 질환의 발생과 관련이 있으며, 사망률도 증가시키는 것으로 보고되고 있다. 뿐만 아니라, 산업현장에서도 미세먼지에 대한 피해가 속출한다. 그러나 현대인의 삶에서 미세먼지 노출은 불가피하다. 그러므로 미세먼지를 예측하여, 이에 대한 노출을 최소화하는 것이 건강 및 산업 피해축소에 가장 효율적인 방법일 것이다. 기존의 미세먼지 예측 모델은 농도 수치가 아닌 미세먼지의 농도 범위에 따라 좋음, 보통, 나쁨, 매우 나쁨으로만 나누어 예보하고 있다. 본 논문은 기존의 실제 기상 및 대기 질 데이터를 이용, 기계학습 알고리즘인 Artificial Neural Network (ANN)알고리즘과 K-Nearest Neighbor (K-NN)알고리즘을 상호 응용하여 미세먼지 수치 (PM 10)를 예측하고자 하였다.
Recently, as the fine dust level has risen rapidly, there is a great interest. Exposure to fine dust is associated with the development of respiratory and cardiovascular diseases and has been reported to increase death rate. In addition, there exist damage to fine dusts continues at industrial sites...
Recently, as the fine dust level has risen rapidly, there is a great interest. Exposure to fine dust is associated with the development of respiratory and cardiovascular diseases and has been reported to increase death rate. In addition, there exist damage to fine dusts continues at industrial sites. However, exposure to fine dust is inevitable in modern life. Therefore, predicting and minimizing exposure to fine dust is the most efficient way to reduce health and industrial damages. Existing fine dust prediction model is estimated as good, normal, poor, and very bad, depending on the concentration range of the fine dust rather than the concentration value. In this paper, we study and implement to predict the PM10 level by applying the Artificial neural network algorithm and the K-Nearest Neighbor algorithm, which are machine learning algorithms, using the actual weather and air quality data.
Recently, as the fine dust level has risen rapidly, there is a great interest. Exposure to fine dust is associated with the development of respiratory and cardiovascular diseases and has been reported to increase death rate. In addition, there exist damage to fine dusts continues at industrial sites. However, exposure to fine dust is inevitable in modern life. Therefore, predicting and minimizing exposure to fine dust is the most efficient way to reduce health and industrial damages. Existing fine dust prediction model is estimated as good, normal, poor, and very bad, depending on the concentration range of the fine dust rather than the concentration value. In this paper, we study and implement to predict the PM10 level by applying the Artificial neural network algorithm and the K-Nearest Neighbor algorithm, which are machine learning algorithms, using the actual weather and air quality data.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 ANN algorithm과 K-NN algorithm을 상호 응용하여 미세먼지 농도 수치를 예측하려 한다(그림 4).
본 논문에서는 기계학습 알고리즘들을 상호 응용하여 데이터 마이닝을 하였고, 서울지역의 미세먼지를 대상으로 농도 수치를 예측해보는 새로운 모델을 제안해보았다. 그러나, 대기질 예측이 100%정확한 데이터가 아니기 때문에 이를 바탕으로 한 예측 또한 원하는 정확도를 얻지 못한다는 한계가 있었다.
제안 방법
기상청에서 공개한 데이터들을 .xslx파일로 수집하였고, 이를 알고리즘에 입력하기 위하여 일차적으로 가공하였다. 또한 알고리즘의 결과를 추출하기 위하여 각인자들의 관계에 대한 상관관계와 상당히 많은 배경지식이 요구되었다.
이러한 데이터들을 바탕으로 대기질 인자들과 기후인자들을 앞서 설명한 Artificial Neural Network의 input data layer로 입력하였다. 각 인자들은 일평균으로 일괄 처리하였고, 인자들의 상관도를 고려하여 활성화 함수를 이용, 가중치를 부여하였다. 이 과정은 분야가 다르기 때문에 많은 시간과 배경지식이 요구되었다.
그 이후, K-NN알고리즘을 이용하여 ANN알고리즘에 의한 output을 분류하였다. 여러 실험에 걸친 후에 K = 9 일 때 가장 높은 정확도를 가진다는 것을 알 수 있었다.
2014년부터 2016년 6월까지의 데이터는 각각 모두 입력하여 학습하였다. 그 후 2017년 6월 30일까지 1년 데이터를 사용 및 예측하여 비교하였다. 기상청에서 공개한 데이터들을 .
2014년 1월 1일부터 2017년 6월 31일까지, 3년 반 동안의 데이터를 학습시켜 출력된 데이터를, 앞서 설명한 K-Nearest Neighbor algorithm을 이용하여, 분류 하였다. 그리하여 Artificial Neural Network알고리즘만 이용 했을 때와, K-Nearest Neighbor algorithm알고리즘만 사용 하였을 때, 그리고 제안 알고리즘에 의한 실험 결과 데이터 등을 이용하여 알고리즘 정확도를 계산하였다.
미세먼지에 영향을 끼치는 기상인자로 일기유형, 기온, 상대습도, 풍속, 풍향으로 설정한 후, Data Mining Tool인 WEKA를 활용하여 Machine-Learning알고리즘을 사용 미세먼지 수치를 예측한 연구가 있다. 기상인자를 변수로 두어, 각기 다른 알고리즘에 적용하여 미세먼지 예측 정확도를 비교하였다 [3].
forecasted meterological data는 강수량, 풍속, 습도, 일조량, 기온의 기상 인자 데이터를 말한다. 이러한 데이터들을 바탕으로 대기질 인자들과 기후인자들을 앞서 설명한 Artificial Neural Network의 input data layer로 입력하였다. 각 인자들은 일평균으로 일괄 처리하였고, 인자들의 상관도를 고려하여 활성화 함수를 이용, 가중치를 부여하였다.
대상 데이터
그 후 2017년 6월 30일까지 1년 데이터를 사용 및 예측하여 비교하였다. 기상청에서 공개한 데이터들을 .xslx파일로 수집하였고, 이를 알고리즘에 입력하기 위하여 일차적으로 가공하였다.
수집된 데이터는 기상청에서 제공한 대기질 측정자료 통계와 기상 실제측정 데이터, 그리고 기상 예보 데이터이다. 제안 알고리즘엔 앞서 말한 10개의 인자가 사용된다.
수집된 데이터는 기상청에서 제공한 대기질 측정자료 통계와 기상 실제측정 데이터, 그리고 기상 예보 데이터이다. 제안 알고리즘엔 앞서 말한 10개의 인자가 사용된다. 10개의 인자는 각각 일평균 수치 값으로 통일하여 대입하였다.
데이터처리
ANN알고리즘을 가동하기 위해선 먼저 Input layer에서 hidden layer에 대한 weight와 hidden layer에서 output에 대한 weight를 알아야 한다. weight를 구하기 위해, PM10을 포함한 총 14개의 변수들을 통하여 다중회귀 분석을 실시하여 값을 추출하였다. 그림5를 보면 추출한 weight를 이용하여, input layer에 13개의 노드, hidden layer에서의 15개의 노드, 그리고 output layer에 1개의 노드로 ,총 3-layer로 이루어진 network를 구성하였다는 것을 알 수 있다.
이론/모형
이 과정은 분야가 다르기 때문에 많은 시간과 배경지식이 요구되었다. 2014년 1월 1일부터 2017년 6월 31일까지, 3년 반 동안의 데이터를 학습시켜 출력된 데이터를, 앞서 설명한 K-Nearest Neighbor algorithm을 이용하여, 분류 하였다. 그리하여 Artificial Neural Network알고리즘만 이용 했을 때와, K-Nearest Neighbor algorithm알고리즘만 사용 하였을 때, 그리고 제안 알고리즘에 의한 실험 결과 데이터 등을 이용하여 알고리즘 정확도를 계산하였다.
성능/효과
그림8은 최종결과를 비교하여 그래프로 나타낸 결과이다. ANN과 K-NN보다 제안 모델이 실제 데이터와 가장 비슷한 추이와 지표를 나타내는 것을 확인할 수 있다.
그 이후, K-NN알고리즘을 이용하여 ANN알고리즘에 의한 output을 분류하였다. 여러 실험에 걸친 후에 K = 9 일 때 가장 높은 정확도를 가진다는 것을 알 수 있었다.(그림 6)
후속연구
그러나, 대기질 예측이 100%정확한 데이터가 아니기 때문에 이를 바탕으로 한 예측 또한 원하는 정확도를 얻지 못한다는 한계가 있었다. 만약 기상 예보나 대기질 예측 정확도가 상승한다면, 제안한 모델을 이용하여 미세먼지 예측도 또한 자연히 상승할 것으로 기대해본다. 미세 먼지는 대기질과 기상뿐만 아니라, 배출, 황사, 장마 등으로 인한 영향도 상당히 크다.
미세 먼지는 대기질과 기상뿐만 아니라, 배출, 황사, 장마 등으로 인한 영향도 상당히 크다. 향후 연구로는 이러한 요소들도 고려하여 더 정확한 예측이 가능할 것으로 예상된다 [9, 10].
질의응답
핵심어
질문
논문에서 추출한 답변
미세먼지의 농도가 사람에게 미치는 영향은?
미세먼지의 농도가 증가할수록 전체 사망률과 심장혈관 및 호흡기계 질환으로 인한 사망률이 증가한다[1].미세먼지 장기 노출과 폐암 및 심혈관질환 사망률의 연관성이 높고 단순히 호흡기계 뿐만 아니라 암과 심혈관계 등과 같은 전신 질환과도 깊은 관련이 있다 [2].
미세먼지는 무엇인가?
미세먼지는 아황산가스, 질소 산화물, 납, 오존, 일산화탄소 등과 함께 수많은 대기오염물질을 포함하는 대기오염 물질로 자동차, 공장 등에서 발생하여 대기 중 장기간 떠다니는 입경 10㎛ 이하의 미세한 먼지이며, PM10이라 한다. 미세먼지는 부유분진, 입자상물질 등으로도 불리며 명칭에 따라 약간씩 다른 의미를 가지고있다.
외국에서 들어오는 미세먼지의 요인은?
위에 언급한 것 외에도 우리나라 자체에서 발생하는 미세먼지와 더불어, 외국에서 들어오는 미세먼지 또한 무시할 수 있는 수준이 아니다. 중국 공업지대에서 편서풍을 타고 날아오는 산업먼지와, 각종 사막과 고원에서 발생하여 많은 양의 큰 입자와 작은 입자의 먼지를 동반 수송하는 황사에 의해 미세먼지 수치가 급격히 증가하기도 한다.
참고문헌 (10)
J. S. Oh, S. H. Park, M. K. Kwak, C. H. Pyo, K. H. Park, , H. B. Kim, S. Y. Shin, and H. J. Choi, "Ambient Particulate Matter and Emergency Department Visit for Chronic Obstructive Pulmonary Disease," Journal of The Korean Society of Emergency Medicine, vol. 28, no. 1, pp. 32-39, Jan. 2017.
H. J. Bae, "Effect of Short-term Exposure to PM10 and PM2.5 on Mortality in Seoul," Journal of Korea Society of Environmental Health vol.40, no.5, pp. 346-354, May 2014.
B. D. Oh, J. H. Park, and Y. S. Kim, "Prediction of the concentration of PM10 using Machine-Learning," Journal of Korea Information Science Society, vol. 20, no. 12, pp. 1674 -1676. Dec. 2016.
Y. S. Koo, H. Y. Yun, H. Y. Kwon, and S. H. Yu, "A Develope of PM10 Forecasting System," Journal of Korean Society for Atmospheric Environment, vol. 26, no. 6, pp. 666-682, Nov. 2010.
Artificial neural network [Internet] Available : http://en.wikipedia.org/wiki/Artificial_neural_network
W. Goki, Study of deep learning from scratch translated Korean, Hanbit Media, Seoul. 2016.
N. S. Altman, "An Introduction to Kernel and Nearest-Neighbor Nonparametric Regression," The American Statistician, vol. 46, no. 3, pp. 175-185, Mar. 1992.
M. L. Zhang, and Z. H. Zhou, "A k-Nearest Neighbor Based Algorithm for Multi-label Classification," Granular Computing, 2005 IEEE International Conference on Beijing: China, pp. 718-721, May 2005.
Gitae Kim, "Data Mining for Spam Email Classification," Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology, ISSN:2383-5285, Vol.6, No.7, pp. 37-47, July 2016.
Jin-Ho Noh, and Han-Ho Tack, "The Implementation of the Fine Dust Measuring System based on Internet of Things(IoT)," The Korea Institute of Information and Communication Engineering, Journal of the Korea Institute of Information and Communication Engineering, vol. 21, no. 4, pp. 829-835, April 2017.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.