현재 한국을 포함한 아시아권에서는 미세먼지로 인한 질병이 심각하다. 특히 미세먼지로 인한 호흡기 관련 질병 발생률이 극심하여 미세먼지 발생억제와 미세먼지 농도 예측에 관한 연구들이 진행되어왔다. 예측 대상인 미세먼지 농도는 기상적 요소에 영향을 받기 때문에, 특정 기상요소들을 바탕으로 시계열 데이터를 구성하여 예측을 진행해왔다. 하지만 기존의 연구들은 시계열 데이터를 구성하여 ...
현재 한국을 포함한 아시아권에서는 미세먼지로 인한 질병이 심각하다. 특히 미세먼지로 인한 호흡기 관련 질병 발생률이 극심하여 미세먼지 발생억제와 미세먼지 농도 예측에 관한 연구들이 진행되어왔다. 예측 대상인 미세먼지 농도는 기상적 요소에 영향을 받기 때문에, 특정 기상요소들을 바탕으로 시계열 데이터를 구성하여 예측을 진행해왔다. 하지만 기존의 연구들은 시계열 데이터를 구성하여 시계열 특성에 적합한 알고리즘들을 사용하지만, 이는 단순히 데이터 취득 후, 알고리즘에 대입하는 과정의 반복으로 시계열 데이터의 특성을 제대로 사용하지 못했다. 이러한 기존의 미세먼지 농도 예측과정의 첫 번째 문제는 입력과 출력을 포함하는 데이터 간의 상관관계에 대한 정량적 지표의 언급이 없다는 점이다. 그리고 두 번째는 시계열의 특성을 가지는 데이터를 구성했지만, 그 특성에 적합한 시계열 데이터 분석이 이루어지지 않았다는 점이다. 세 번째는 알고리즘의 검증지표를 통한 정확도와 오차의 계산은 진행되지만, 잔차 진단을 통해 실질적인 모델의 발전을 위한 개선방안을 제시하거나 종료를 선언하는 과정이 없다. 이는 잔차 진단을 통해 모델의 개선 여지의 유무를 파악하고, 개선의 여지가 있다면 개선방안을 제안하고 개선방안이 없다면 모델의 종료를 선언하는 과정이다. 본 논문에서는 심층 순환신경망(deep recurrent neural network, DRNN)을 구현하여 서울시의 미세먼지 농도를 예측하는 모델을 구축한다. 서울시의 미세먼지 농도 예측을 위해 서울시와 인접한 다른 도시들이 영향을 미칠 것으로 가정하고, 그에 합당한 정량적 근거를 제시하여 지역 선정을 진행한다. 미세먼지 농도 예측을 위한 입력 데이터 선정은 미세먼지 발생원과 발생 후의 증감현상, 두 가지 부분으로 나누어 진행하였다. 수집한 데이터를 바탕으로 상관관계 분석을 통해 최종 입력 데이터를 선정했으며, 이렇게 구성된 시계열 데이터를 기반으로 그에 적합한 데이터 분석을 수행한다. 심층 순환신경망은 선정된 입력 데이터를 기반으로 서울시 미세먼지 농도를 예측하며, MAE(mean absolute error), MSE(mean squared error), RMSE(root mean squared error)를 검증지표로 사용하여 알고리즘의 성능을 평가한다. 마지막으로 잔차 진단을 통해 미세먼지 예측 모델의 개선 여부를 파악하고, 개선의 여지가 있다면 수정 및 재학습을 진행하며 개선의 여지가 없다면 모델의 종료를 선언한다.
현재 한국을 포함한 아시아권에서는 미세먼지로 인한 질병이 심각하다. 특히 미세먼지로 인한 호흡기 관련 질병 발생률이 극심하여 미세먼지 발생억제와 미세먼지 농도 예측에 관한 연구들이 진행되어왔다. 예측 대상인 미세먼지 농도는 기상적 요소에 영향을 받기 때문에, 특정 기상요소들을 바탕으로 시계열 데이터를 구성하여 예측을 진행해왔다. 하지만 기존의 연구들은 시계열 데이터를 구성하여 시계열 특성에 적합한 알고리즘들을 사용하지만, 이는 단순히 데이터 취득 후, 알고리즘에 대입하는 과정의 반복으로 시계열 데이터의 특성을 제대로 사용하지 못했다. 이러한 기존의 미세먼지 농도 예측과정의 첫 번째 문제는 입력과 출력을 포함하는 데이터 간의 상관관계에 대한 정량적 지표의 언급이 없다는 점이다. 그리고 두 번째는 시계열의 특성을 가지는 데이터를 구성했지만, 그 특성에 적합한 시계열 데이터 분석이 이루어지지 않았다는 점이다. 세 번째는 알고리즘의 검증지표를 통한 정확도와 오차의 계산은 진행되지만, 잔차 진단을 통해 실질적인 모델의 발전을 위한 개선방안을 제시하거나 종료를 선언하는 과정이 없다. 이는 잔차 진단을 통해 모델의 개선 여지의 유무를 파악하고, 개선의 여지가 있다면 개선방안을 제안하고 개선방안이 없다면 모델의 종료를 선언하는 과정이다. 본 논문에서는 심층 순환신경망(deep recurrent neural network, DRNN)을 구현하여 서울시의 미세먼지 농도를 예측하는 모델을 구축한다. 서울시의 미세먼지 농도 예측을 위해 서울시와 인접한 다른 도시들이 영향을 미칠 것으로 가정하고, 그에 합당한 정량적 근거를 제시하여 지역 선정을 진행한다. 미세먼지 농도 예측을 위한 입력 데이터 선정은 미세먼지 발생원과 발생 후의 증감현상, 두 가지 부분으로 나누어 진행하였다. 수집한 데이터를 바탕으로 상관관계 분석을 통해 최종 입력 데이터를 선정했으며, 이렇게 구성된 시계열 데이터를 기반으로 그에 적합한 데이터 분석을 수행한다. 심층 순환신경망은 선정된 입력 데이터를 기반으로 서울시 미세먼지 농도를 예측하며, MAE(mean absolute error), MSE(mean squared error), RMSE(root mean squared error)를 검증지표로 사용하여 알고리즘의 성능을 평가한다. 마지막으로 잔차 진단을 통해 미세먼지 예측 모델의 개선 여부를 파악하고, 개선의 여지가 있다면 수정 및 재학습을 진행하며 개선의 여지가 없다면 모델의 종료를 선언한다.
Currently, diseases caused by PM10 are serious in Asia, including Korea. In particular, many studies have been conducted by suppressing the occurrence of PM10 and predicting the concentration of PM10 due to the extreme incidence of respiratory diseases caused by PM10. Since the concentration of PM10...
Currently, diseases caused by PM10 are serious in Asia, including Korea. In particular, many studies have been conducted by suppressing the occurrence of PM10 and predicting the concentration of PM10 due to the extreme incidence of respiratory diseases caused by PM10. Since the concentration of PM10, which is the target of prediction, is affected by meteorological factors, time series data have been constructed and predicted based on specific meteorological factors. The existing studies use algorithms that are suitable for time series characteristics by constructing time series data. However, this is simply repeating the process of substituting the algorithm after the data acquisition. So, the characteristics of time series data were not properly used. The first problem with the existing PM10 concentration prediction process is that there is no quantitative mention of the correlation between data including input and output. Second, the data with the characteristics of time series were constructed, but data analysis suitable for the characteristics was not conducted. Third, the calculation of accuracy and error through the algorithm's verification index is in progress, but there is no process of suggesting improvement measures or declaring termination for the development of the actual model through residual diagnosis. This is the process of identifying the possibilities of improvement of the model through residual diagnosis, suggesting the improvement plan, if there is a possibilities of improvement, and declaring the end of the model, if there is no improvement plan. In this paper, a model for predicting the concentration of PM10 in Seoul is constructed by implementing a deep recurrent neural network (DRNN). In order to predict the concentration of PM10 in Seoul, it is assumed that other cities adjacent to Seoul will have an impact, and regional selection is carried out by presenting a reasonable quantitative basis. The selection of input data for predicting the concentration of PM10 was divided into two parts: the source of PM10, and the increased, and decreased phenomenon after the occurrence. Based on the collected data, the final input data was selected through correlation analysis, and based on the time series data configured in this way, appropriate data analysis is performed. The deep circulating neural network predicts the concentration of PM10 in Seoul based on the selected input data, and evaluates the performance of the algorithm using mean absolute error(MAE), mean square error (MSE), and root mean square error (RMSE) as verification indicators. Finally, the PM10 prediction model is identified through residual diagnosis, and if there is a possibilities of improvement, correction and re-learning are conducted, and if there is no possibilities of improvement, the model will be declared to the end.
Currently, diseases caused by PM10 are serious in Asia, including Korea. In particular, many studies have been conducted by suppressing the occurrence of PM10 and predicting the concentration of PM10 due to the extreme incidence of respiratory diseases caused by PM10. Since the concentration of PM10, which is the target of prediction, is affected by meteorological factors, time series data have been constructed and predicted based on specific meteorological factors. The existing studies use algorithms that are suitable for time series characteristics by constructing time series data. However, this is simply repeating the process of substituting the algorithm after the data acquisition. So, the characteristics of time series data were not properly used. The first problem with the existing PM10 concentration prediction process is that there is no quantitative mention of the correlation between data including input and output. Second, the data with the characteristics of time series were constructed, but data analysis suitable for the characteristics was not conducted. Third, the calculation of accuracy and error through the algorithm's verification index is in progress, but there is no process of suggesting improvement measures or declaring termination for the development of the actual model through residual diagnosis. This is the process of identifying the possibilities of improvement of the model through residual diagnosis, suggesting the improvement plan, if there is a possibilities of improvement, and declaring the end of the model, if there is no improvement plan. In this paper, a model for predicting the concentration of PM10 in Seoul is constructed by implementing a deep recurrent neural network (DRNN). In order to predict the concentration of PM10 in Seoul, it is assumed that other cities adjacent to Seoul will have an impact, and regional selection is carried out by presenting a reasonable quantitative basis. The selection of input data for predicting the concentration of PM10 was divided into two parts: the source of PM10, and the increased, and decreased phenomenon after the occurrence. Based on the collected data, the final input data was selected through correlation analysis, and based on the time series data configured in this way, appropriate data analysis is performed. The deep circulating neural network predicts the concentration of PM10 in Seoul based on the selected input data, and evaluates the performance of the algorithm using mean absolute error(MAE), mean square error (MSE), and root mean square error (RMSE) as verification indicators. Finally, the PM10 prediction model is identified through residual diagnosis, and if there is a possibilities of improvement, correction and re-learning are conducted, and if there is no possibilities of improvement, the model will be declared to the end.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.