고농도 미세먼지 발생이 증가함에 따라 미세먼지 예측에 많은 관심이 집중되고 있다. 미세먼지는 대기 중에 있는 직경 $10{\mu}m$ 이하의 밀입자 물질을 말하며, 온도, 상대습도, 풍속 등의 기상 변화에 영향을 받는다. 따라서 미세먼지 예측을 위해 기상 정보와의 상관관계를 분석하는 다양한 연구가 진행되었다. 하지만 미세먼지의 비선형적 시계열 분포는 예측 모델의 복잡도를 증가시키고, 부정확한 예측값을 초래할 수 있다. 본 연구에서는 기계학습의 군집 알고리즘 및 분류알고리즘을 이용하여 미세먼지의 비선형적 특성을 완화하고자 한다. 사용된 기계학습 알고리즘은 병합군집, 밀도기반군집이며, 각 알고리즘을 통한 군집결과를 비교, 분석하였다.
고농도 미세먼지 발생이 증가함에 따라 미세먼지 예측에 많은 관심이 집중되고 있다. 미세먼지는 대기 중에 있는 직경 $10{\mu}m$ 이하의 밀입자 물질을 말하며, 온도, 상대습도, 풍속 등의 기상 변화에 영향을 받는다. 따라서 미세먼지 예측을 위해 기상 정보와의 상관관계를 분석하는 다양한 연구가 진행되었다. 하지만 미세먼지의 비선형적 시계열 분포는 예측 모델의 복잡도를 증가시키고, 부정확한 예측값을 초래할 수 있다. 본 연구에서는 기계학습의 군집 알고리즘 및 분류알고리즘을 이용하여 미세먼지의 비선형적 특성을 완화하고자 한다. 사용된 기계학습 알고리즘은 병합군집, 밀도기반군집이며, 각 알고리즘을 통한 군집결과를 비교, 분석하였다.
As the generation of high concentration particulate matter increases, much attention is focused on the prediction of particulate matter. Particulate matter refers to particulate matter less than $10{\mu}m$ diameter in the atmosphere and is affected by weather changes such as temperature, ...
As the generation of high concentration particulate matter increases, much attention is focused on the prediction of particulate matter. Particulate matter refers to particulate matter less than $10{\mu}m$ diameter in the atmosphere and is affected by weather changes such as temperature, relative humidity and wind speed. Therefore, various studies have been conducted to analyze the correlation with weather information for particulate matter prediction. However, the nonlinear time series distribution of particulate matter increases the complexity of the prediction model and can lead to inaccurate predictions. In this paper, we try to mitigate the nonlinear characteristics of particulate matter by using cluster algorithm and classification algorithm of machine learning. The machine learning algorithms used are agglomerative clustering, density-based spatial clustering of applications with noise(DBSCAN).
As the generation of high concentration particulate matter increases, much attention is focused on the prediction of particulate matter. Particulate matter refers to particulate matter less than $10{\mu}m$ diameter in the atmosphere and is affected by weather changes such as temperature, relative humidity and wind speed. Therefore, various studies have been conducted to analyze the correlation with weather information for particulate matter prediction. However, the nonlinear time series distribution of particulate matter increases the complexity of the prediction model and can lead to inaccurate predictions. In this paper, we try to mitigate the nonlinear characteristics of particulate matter by using cluster algorithm and classification algorithm of machine learning. The machine learning algorithms used are agglomerative clustering, density-based spatial clustering of applications with noise(DBSCAN).
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
대표적인 알고리즘은 k-means, 병합군집, DBSCAN이며, 선행된 연구를 통해 k-means의 군집 특성을 파악하였다[6]. 따라서 본 논문에서는 병합군집, DBSCAN의 군집 특성을 파악하고자 한다.
하지만 미세먼지의 비선형적 시계열 분포는 예측 모델의 복잡도를 증가 시키고, 부정확한 예측 결과를 도출할 수 있다. 따라서 본연구에서는 기계학습 기반의 군집 알고리즘인 병합군집과 DBSCAN을 이용하여 미세먼지의 비선형적 특성을 완화하고자 한다. 미세먼지와 습도 데이터를 사용하여 군집 알고리즘 수행하였으며, Boxplot으로 평가하였다.
이에 본 논문에서는 미세먼지 예측에 앞서, 미세먼지 농도의 비선형적 시계열 분포를 기계학습의 군집 알고리즘을 통해 완화하고자 한다. 사용된 알고리즘은 병합군집, DBSCAN이며, 성능을 평가하기 위해 미세먼지 농도의 군집 결과를 확인하였다.
제안 방법
따라서 본연구에서는 기계학습 기반의 군집 알고리즘인 병합군집과 DBSCAN을 이용하여 미세먼지의 비선형적 특성을 완화하고자 한다. 미세먼지와 습도 데이터를 사용하여 군집 알고리즘 수행하였으며, Boxplot으로 평가하였다. 병합군집의 경우, 고농도 미세먼지 구간에서 몇몇 이상치가 발생하였으며, 저 농도 및 중간 농도를 분별할 수 있음을 보였다.
이에 본 논문에서는 미세먼지 예측에 앞서, 미세먼지 농도의 비선형적 시계열 분포를 기계학습의 군집 알고리즘을 통해 완화하고자 한다. 사용된 알고리즘은 병합군집, DBSCAN이며, 성능을 평가하기 위해 미세먼지 농도의 군집 결과를 확인하였다.
성능/효과
DBSCAN의 경우, 각 좌표상의 데이터 사이의 거리를 측정하여 근접한 데이터를 군집하기 때문에 특성이 확실하게 구분된 데이터에 적합하다. 하지만 미세먼지 및 습도 데이터가 나타내는 부정확한 분포는 알고리즘 수행 후 많은 noise와 함께 편향된 군집 결과를 보였다.
후속연구
하지만 DBSCAN은 많은 noise와 편향된 군집 결과로 인해 미세먼지 군집에 적합하지 않음을 나타내었다. 병합군집을 이용한 미세먼지 예측 시나리오를 설계할 경우, 보다 정확한 예측 결과를 도출할 것으로 판단된다. 향후 연구로는 농도별로 구분된 미세먼지 데이터를 통해 기계학습 및 시계열분석을 이용한 구간별 미세먼지 예측모델을 설계할 예정이다.
병합군집을 이용한 미세먼지 예측 시나리오를 설계할 경우, 보다 정확한 예측 결과를 도출할 것으로 판단된다. 향후 연구로는 농도별로 구분된 미세먼지 데이터를 통해 기계학습 및 시계열분석을 이용한 구간별 미세먼지 예측모델을 설계할 예정이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.