본 연구는 PM10 농도에 대한 계량치 예측모형 개발을 목적으로 한다. 세 종류의 자료 (기상관측 자료, 세계기상통신망 중국 관측자료, 대기질 화학수치모델자료)를 예측인자로 사용하였으며, 일일 단기예보 시스템에 쉽게 적용할 수 있도록 시간자료를 일자료로 변환하였고 시차변환을 수행하였다. 상관분석과 다중공선성 진단을 통하여 예측인자를 선택하고 두 종류의 모형 (중회귀모형, 문턱치회귀모형)을 각각 적합하였다. 모형 안정성 검사를 위하여 모형검증을 수행하였으며, 전체자료를 사용하여 모형을 재추정한 후 예측치와 관측치 사이의 산점도와 시계열그림, RMSE, 예측성 평가측도를 작성 및 산출하여 두 모형을 비교하였다. 문턱치 회귀모형의 예측력이 고농도 PM10예측에서 다소 우수한 결과를 보였다.
본 연구는 PM10 농도에 대한 계량치 예측모형 개발을 목적으로 한다. 세 종류의 자료 (기상관측 자료, 세계기상통신망 중국 관측자료, 대기질 화학수치모델자료)를 예측인자로 사용하였으며, 일일 단기예보 시스템에 쉽게 적용할 수 있도록 시간자료를 일자료로 변환하였고 시차변환을 수행하였다. 상관분석과 다중공선성 진단을 통하여 예측인자를 선택하고 두 종류의 모형 (중회귀모형, 문턱치 회귀모형)을 각각 적합하였다. 모형 안정성 검사를 위하여 모형검증을 수행하였으며, 전체자료를 사용하여 모형을 재추정한 후 예측치와 관측치 사이의 산점도와 시계열그림, RMSE, 예측성 평가측도를 작성 및 산출하여 두 모형을 비교하였다. 문턱치 회귀모형의 예측력이 고농도 PM10예측에서 다소 우수한 결과를 보였다.
The objective of the present study is to develop statistical quantitative forecast model for PM10 concentration over Seoul. We used three types of data (weather observation data in Korea, the China's weather observation data collected by GTS, and air quality numerical model forecasts). To apply the ...
The objective of the present study is to develop statistical quantitative forecast model for PM10 concentration over Seoul. We used three types of data (weather observation data in Korea, the China's weather observation data collected by GTS, and air quality numerical model forecasts). To apply the daily forecast system, hourly data are converted to daily data and then lagging was performed. The potential predictors were selected based on correlation analysis and multicollinearity check. Model validation has been performed for checking model stability. We applied two models (multiple regression model and threshold regression model) separately. The two models were compared based on the scatter plot of forecasts and observations, time series plots, RMSE, skill scores. As a result, a threshold regression model performs better than multiple regression model in high PM10 concentration cases.
The objective of the present study is to develop statistical quantitative forecast model for PM10 concentration over Seoul. We used three types of data (weather observation data in Korea, the China's weather observation data collected by GTS, and air quality numerical model forecasts). To apply the daily forecast system, hourly data are converted to daily data and then lagging was performed. The potential predictors were selected based on correlation analysis and multicollinearity check. Model validation has been performed for checking model stability. We applied two models (multiple regression model and threshold regression model) separately. The two models were compared based on the scatter plot of forecasts and observations, time series plots, RMSE, skill scores. As a result, a threshold regression model performs better than multiple regression model in high PM10 concentration cases.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구는 서울지역 PM10 농도에 대한 계량치 예측치를 생산하는 통계모형 개발을 목적으로 하고 있으며, PM10에 초점을 맞추어 연구설계와 분석이 수행되었다. PM10 생성에는 복잡한 화학반응 과정이 포함되어 있어 통계모형 개발에서 이를 모형에 포함시키기 어려우므로, 화학반응과정에 기초하여 모의실험을 수행하는 화학수치모델에서 생산된 예측치를 예측인자로 사용하고자 하였다. 이는 복잡한 화학 반응 과정을 간접적으로 통계모형에 포함시킬 수 있어 통계모형의 예측성 (predictability)을 향상시킬 것으로 기대하기 때문이다.
본 연구는 PM10 농도 일일 단기예보를 목표로 하므로 시간자료를 일자료로 변환하여 사용하였다. 가능한 PM10 농도증가에 영향을 주는 값을 예측인자로 사용하기 위하여 기상청 관련부서와 협의하여 다음과 같이 변환작업을 수행하였다. 국내 기상관측치의 경우 기온을 이용하여 일교차를, 시정과 상대습도를 이용하여 연무발생 여부를 결정하였다.
본 논문은 서울지역 PM10 농도 예측모형 개발을 위하여 중회귀모형과 문턱치 회귀모형을 각각 적합하고 비교한 결과이다. 모형의 타당성을 확보하기 위하여 국내 기상관측치, 중국 GTS 관측치, 대기질 수치모델 예측치를 예측인자로 고려하였다.
본 연구는 서울지역 PM10 농도에 대한 계량치 예측치를 생산하는 통계모형 개발을 목적으로 하고 있으며, PM10에 초점을 맞추어 연구설계와 분석이 수행되었다. PM10 생성에는 복잡한 화학반응 과정이 포함되어 있어 통계모형 개발에서 이를 모형에 포함시키기 어려우므로, 화학반응과정에 기초하여 모의실험을 수행하는 화학수치모델에서 생산된 예측치를 예측인자로 사용하고자 하였다.
문턱치 회귀모형을 고려한 것은 PM10 농도가 지속성이 있을 것이라는 가정 하에서 이용하였다. 본 연구에서는 다음의 모형식으로 표현되는 문턱치 회귀모형을 적합하였다.
첫째, 예측모형 개발이므로 미래시점에 대한 예측치를 생산하기 위하여 현실적으로 사용가능한 자료 들을 예측인자로 사용하여야 한다. 본 연구에서는 일일 예보시스템에 적용이 가능하도록 모형 개발을 하였다. 즉, t 시점의 예측치 생산을 위하여 t − 1 시점의 관측치들을 사용한다.
이번 연구에서 문턱치 회귀모형을 고려했을 때 고농도 PM10에 대한 예측성 향상에 대한 가능성을 보았다. 이를 바탕으로 PM10 농도예측을 전국으로 확대하고자 한다. 지역에 따라 미세먼지의 원인이 다양 하게 구성되므로 이에 대한 고려가 필요하다.
예측모형 개발은 고농도 PM10으로 인한 피해로부터 국민건강 보호 및 경제적 피해 감소에 초점을 맞추고있으므로 전체적인 정확성보다 고농도일 때의 정확성을 향상시키는데 중점을 두는 것이 바람직하다. 이번 연구에서 문턱치 회귀모형을 고려했을 때 고농도 PM10에 대한 예측성 향상에 대한 가능성을 보았다. 이를 바탕으로 PM10 농도예측을 전국으로 확대하고자 한다.
예를 들어, 부산지역은 선박에 의한 대기오염이 유의한 영향을 미칠 것으로 예상되어 관련된 자료의 추가가 요구된다. 현재 미세먼지 농도 예측을 위한 통계모형에서 예측의 정확도가 미흡한 상태이므로 더 향상된 예측품질을 위하여 향후 연구로 다양한 모형을 고려하고자 한다. 비선형 회귀모형, 다중 문턱치 모형 등 예측모형에 대한 지속적인 연구가 필요하며, 교차 상관분석을 통하여 예측인자를 추가하고자 한다.
가설 설정
넷째, PM10 농도예측을 위하여 두 가지 모형 (중회귀모형, 문턱치 회귀모형)을 적용하고 비교한다. 문턱치 회귀모형을 고려한 것은 PM10 농도가 지속성이 있을 것이라는 가정 하에서 이용하였다. 본 연구에서는 다음의 모형식으로 표현되는 문턱치 회귀모형을 적합하였다.
시계열모형에 의한 예측은 과거로부터 현재까지의 변화패턴이 미래에도 유지된다는 가정아래 이루어진다. 이를 뒷받침하기 위하여 모형검증이 수행된다.
제안 방법
넷째, PM10 농도예측을 위하여 두 가지 모형 (중회귀모형, 문턱치 회귀모형)을 적용하고 비교한다. 문턱치 회귀모형을 고려한 것은 PM10 농도가 지속성이 있을 것이라는 가정 하에서 이용하였다.
다섯째, 자료를 모형 훈련자료와 검증자료로 나누어 모형검증을 실시하여 모형의 안정성을 검사한다. 먼저 훈련자료로 모형을 적합시킨 뒤 예측치를 생산한다.
둘째, PM10 농도와 유의한 상관을 보이는 기상인자들을 선택하기위해 예측인자들에 대하여 상관분석을 실시하여 유의한 (p-value<0.15) 변수들만 예측모형 개발에 사용하였다.
훈련자료로 적합시킨 모형이 검증자료에서 일관성을 보이므로 모형이 안정적이라고 판단할 수 있다. 모형의 안정성이 확인되었으므로 전체자료를 이용하여 예측모형을 적합하였다.
이를 뒷받침하기 위하여 모형검증이 수행된다. 모형훈련자료로 모형을 추정한 후 추정된 모형을 검증자료에 적용하여 예측모형의 안정성을 검토한다. 안정성이 있다고 판단되면 전체자료로 재추정하여 예측모형으로 사용한다.
1) 변수들만 선택하였다. 문턱치 선정기준은 문턱치를 기준으로 데이터를 분할했을 때 데이터개수가 적절히 선택되도록, PM10이 고농도일 때 모형의 예측성을 높일 수 있도록 선택하였다.
05에서 다르다고 할 수 없다. 문턱치 회귀모형에서도 모형의 안정성이 확보되었으므로 전체자료를 이용하여 모형을 적합시켰다. 전날 PM10농도 (LPM)에서 문턱치를 기준으로 자료를 나누어 회귀모형을 각각 적합한 결과는 각각 Table 3.
문턱치 회귀모형은 다양한 종류가 있으며, 본 연구에서는 문턱치 (threshold)에 의하여 두 가지 모형으로 구성되는 문턱치 회귀모형을 고려하였다. 문턱치를 고려하지 않았을 때의 중회귀모형을 적합시켜 문턱치 회귀모형의 결과와 비교하였다. Tong (1983)에서 다양한 형태의 문턱치 회귀모형들을 소개하고 있으니 참고하기 바란다.
본 연구는 PM10 농도 일일 단기예보를 목표로 하므로 시간자료를 일자료로 변환하여 사용하였다. 가능한 PM10 농도증가에 영향을 주는 값을 예측인자로 사용하기 위하여 기상청 관련부서와 협의하여 다음과 같이 변환작업을 수행하였다.
Murphy (1993)는 좋은 예측모형의 조건을 제시하면서 예측성 평가측도의 사용을 강조하였다. 본 연구에서는 예측품질과 가치에 중점을 두고 예측정확도 (Accuracy), 탐지확률 (probability of detection, POD), 허위경고율 (false alarm ratio, FAR)을 고려하였다. Accuracy는 모형의 전체적인 정확도를 나타내고, POD는 실제 고농도 PM10이 관측되었을 때 모형에서 고농도 PM10이라고 예측할 확률을 나타낸다.
모든 자료는 시간자료 (hourly data)이며, 자료기간은 세 종류의 자료가 모두 존재하는 기간으로 2012년 5월 1일부터 2013년 8월 12일, 2014년 1월 1일부터 2014년 7월 31일까지의 자료를 사용하였다. 세 종류의 자료에서 기준시간을 한국표준시 (korean standard time, KST)로 통일시킨 후, 결측치 보정작업을 수행하여 자료의 등간격화를 실시하였다. 17시에 기상청예보가 발표된다는 가정아래 국내 기상관측치의 경우 전날 0시부터 14시까지, 중국 GTS 자료는 전날 0시부터 12시까지, 대기질 수치 모델 자료는 해당일 전체의 자료를 각각 사용하였다.
셋째, 계량치 예측치를 문턱치 120을 기준으로 이범주자료로 변환하여 Table 2.2와 같이 이원분할표를 작성한 후, 예측성 평가측도를 산출하여 비교한다. Murphy (1993)는 좋은 예측모형의 조건을 제시하면서 예측성 평가측도의 사용을 강조하였다.
셋째, 모형개발에 사용되는 예측인자들 사이에 다중공선성의 해결을 위하여 문제가 되는 변수를 제거하였다. 분산팽창인수가 10보다 큰 경우 다중공선성이 존재한다고 판단하였다.
첫째, 예측치와 관측치 사이의 산점도 및 시계열그림을 작성하여 예측의 정확도를 가시적으로 비교한다. 시계열그림을 통해 예측의 정확도 및 추세, 주기성을 살펴보고, 두 모형에서 관측치가 고농도일 때 예측의 예측정도를 비교한다.
예측모형의 안정성을 평가하기 위해 자료를 훈련자료 (2012 ∼ 2013년)와 검증자료 (2014년)로 나누어 모형검증을 실시하였다.
단기예보 시스템에서는 예측의 정확도 (accuracy)가 중요하며, PM10 농도 예측의 경우에 전체적 정확도보다 고농도에 대한 예측 정확도에 초점을 맞추어야 한다. 이를 위해 문턱치 회귀모형 (threshold regression model)을 고려하여 고농도에서 예측의 정확도를 향상시키도록 하였다. 문턱치 회귀모형은 다양한 종류가 있으며, 본 연구에서는 문턱치 (threshold)에 의하여 두 가지 모형으로 구성되는 문턱치 회귀모형을 고려하였다.
일곱째, 두 모형의 예측성을 비교하기 위하여, 두 모형에서 생산된 PM10 농도 예측치를 사용하였으며, 다음 절에 설명되는 예측성 평가 측도를 산출하여 비교하였다.
풍향, 해면기압은 일중 평균치를, 강우량, 시정, 온도의경우 일중 최소치를 사용하였고 나머지 예측인자들은 일중 최대치를 사용하였다. 중국 GTS 자료는 풍향, 연무발생은 최대치를, 풍속의 경우 평균치를 사용하였고, 수치모델 예측치는 모두 평균치를 사용하였다. 예측 대상인 PM10 농도는 기상관측소 관측치이며, 자료 변환시 일중 최대치를 사용하였고, 단위는 μg/m3이다.
첫째, 예측치와 관측치 사이의 산점도 및 시계열그림을 작성하여 예측의 정확도를 가시적으로 비교한다. 시계열그림을 통해 예측의 정확도 및 추세, 주기성을 살펴보고, 두 모형에서 관측치가 고농도일 때 예측의 예측정도를 비교한다.
국내 기상관측치의 경우 기온을 이용하여 일교차를, 시정과 상대습도를 이용하여 연무발생 여부를 결정하였다. 풍향, 해면기압은 일중 평균치를, 강우량, 시정, 온도의경우 일중 최소치를 사용하였고 나머지 예측인자들은 일중 최대치를 사용하였다. 중국 GTS 자료는 풍향, 연무발생은 최대치를, 풍속의 경우 평균치를 사용하였고, 수치모델 예측치는 모두 평균치를 사용하였다.
대상 데이터
세 종류의 자료에서 기준시간을 한국표준시 (korean standard time, KST)로 통일시킨 후, 결측치 보정작업을 수행하여 자료의 등간격화를 실시하였다. 17시에 기상청예보가 발표된다는 가정아래 국내 기상관측치의 경우 전날 0시부터 14시까지, 중국 GTS 자료는 전날 0시부터 12시까지, 대기질 수치 모델 자료는 해당일 전체의 자료를 각각 사용하였다.
모든 자료는 시간자료 (hourly data)이며, 자료기간은 세 종류의 자료가 모두 존재하는 기간으로 2012년 5월 1일부터 2013년 8월 12일, 2014년 1월 1일부터 2014년 7월 31일까지의 자료를 사용하였다. 세 종류의 자료에서 기준시간을 한국표준시 (korean standard time, KST)로 통일시킨 후, 결측치 보정작업을 수행하여 자료의 등간격화를 실시하였다.
중국 GTS 자료는 고층 (850 hPa) 기상관측이 가능하고, 한반도 수도권지역 PM10 농도에 영향을 준다고 생각되는 베이징과 칭다오 지역의 관측치를 이용하였다. 모형개발 대상지점은 서울지역이며, 사용된 예측인자의 종류, 변수명, 단위는 Table 2.1에 요약하였다.
본 논문은 서울지역 PM10 농도 예측모형 개발을 위하여 중회귀모형과 문턱치 회귀모형을 각각 적합하고 비교한 결과이다. 모형의 타당성을 확보하기 위하여 국내 기상관측치, 중국 GTS 관측치, 대기질 수치모델 예측치를 예측인자로 고려하였다. 문턱치 회귀모형에서 PM10 농도가 고농도일때 예측성이 298 Keon Tae Sohn · Dahong Kim 중회귀모형보다 향상되었으나, 고농도에서 과소예측되는 점은 여전히 해결해야할 문제로 남아있다.
예측 대상인 PM10 농도는 기상관측소 관측치이며, 자료 변환시 일중 최대치를 사용하였고, 단위는 μg/m3이다.
통계모형 개발을 위하여 세종류의 자료 (기상관측치, 중국 GTS 자료, 대기질 화학수치모델에 의하여 생산된 대기질 자료 예측치) 를 예측인자로 사용하였다. 중국 GTS 자료는 고층 (850 hPa) 기상관측이 가능하고, 한반도 수도권지역 PM10 농도에 영향을 준다고 생각되는 베이징과 칭다오 지역의 관측치를 이용하였다. 모형개발 대상지점은 서울지역이며, 사용된 예측인자의 종류, 변수명, 단위는 Table 2.
한국기상청에서 시정이 10 km미만이고 상대습도가 75%미만인 경우에 연무발생으로 정의하므로 연무발생을 산출하여 예측인자로 사용하였다. 중국에서 발생된 PM10 원인물질이 서풍에 의하여 한반도 PM10 농도에 영향을 미치므로 고층자료인 850 hPa지점의 풍향 중 서풍에 해당하는 자료만 사용하였다. 즉, 서풍계열은 WD=1로, 아니면 WD=0으로 이진자료를 생성하여 사용하였다.
PM10 농도예측은 통계모형에 의해 생성된 예측치를 통해 이루어진다. 통계모형 개발을 위하여 세종류의 자료 (기상관측치, 중국 GTS 자료, 대기질 화학수치모델에 의하여 생산된 대기질 자료 예측치) 를 예측인자로 사용하였다. 중국 GTS 자료는 고층 (850 hPa) 기상관측이 가능하고, 한반도 수도권지역 PM10 농도에 영향을 준다고 생각되는 베이징과 칭다오 지역의 관측치를 이용하였다.
한국기상청에서 시정이 10 km미만이고 상대습도가 75%미만인 경우에 연무발생으로 정의하므로 연무발생을 산출하여 예측인자로 사용하였다. 중국에서 발생된 PM10 원인물질이 서풍에 의하여 한반도 PM10 농도에 영향을 미치므로 고층자료인 850 hPa지점의 풍향 중 서풍에 해당하는 자료만 사용하였다.
데이터처리
둘째, RMSE (root mean square error)를 비교한다. RMSE는 예측오차의 변동성에 대한 수치적인 값으로 전체 변동성에서 모형에 의해 설명되는 변동성을 제외한 값을 제공해준다.
이론/모형
변환된 자료를 이용하여 작성된 두 이원분할표의 동일성검정을 실시하여 두 분할표가 동질적이라면 모형의 안정성이 확보되었다고 판단한다. 두 이원분할표의 동일성을 검정하기 위해 반응변수를 다항분포로 가정하는 로그선형모형 (log-linear model)을 고려하였다. 로그선형모형에 대한 자세한 설명은 Jeong과 Choi (2009)를 참고하길 바란다.
이를 위해 문턱치 회귀모형 (threshold regression model)을 고려하여 고농도에서 예측의 정확도를 향상시키도록 하였다. 문턱치 회귀모형은 다양한 종류가 있으며, 본 연구에서는 문턱치 (threshold)에 의하여 두 가지 모형으로 구성되는 문턱치 회귀모형을 고려하였다. 문턱치를 고려하지 않았을 때의 중회귀모형을 적합시켜 문턱치 회귀모형의 결과와 비교하였다.
성능/효과
2.2절에서 언급한 PM10 농도가 지속성이 있을 것이라는 가정은 전날과 그 다음날의 PM10 농도 관측치의 상관계수가 0.484로 가장 높은 상관관계를 나타나 가정에 대한 타당성을 확보하였다.
76%P 높아 모형의 품질이 좋아졌음을 알 수 있다. FAR 또한 문턱치 회귀모형이 중회귀모형 대비 3.41%P 낮아 허위경고율이 더 낮음을 확인하였다. 두 모형에서의 예측치와 관측치의 이원분할표의 도수가 큰 차이는 없었지만, 고농도 PM10에서 문턱치를 고려한 모형이 중회귀모형보다 향상되었음을 확인하였다.
PM10 생성 원인물질인 황산화물과 질소산화물의 수치모델 예측치인 SULF와 NOX의 회귀계수 부호가 음수로써 원인물질이 적을수록 PM10 농도가 높다는 해석을 할 수 있다. 이는 다른 예측인자의 영향력이 상대적으로 커서 SULF와 NOX가 억제변수 역할을 하여 부호가 음수이거나, SULF와 NOX가 PM10 생성 원인물질이기 때문에 PM10으로 화학반응을 많이 일으키면 그만큼 원인물질은 합성되어 사라지기 때문에 회귀계수 부호가 음수라고 해석할 수 있다.
41%P 낮아 허위경고율이 더 낮음을 확인하였다. 두 모형에서의 예측치와 관측치의 이원분할표의 도수가 큰 차이는 없었지만, 고농도 PM10에서 문턱치를 고려한 모형이 중회귀모형보다 향상되었음을 확인하였다.
4와 같다. 모형의 전체적인 설명력 R2는 41% 정도이며, 최종 예측인자는 중국 기상관측치의 경우 칭다오 지역의 변수만 유의하였고, 상대 적으로 거리가 먼 베이징의 경우 유의하지 않음을 확인하였다. 변수의 단위를 표준화하여 상대적인 영향력을 나타내는 표준화계수를 살펴본 결과 PM10-LPM-NOX-Tdif-VS-WS-HZ-SS-SULF 순으로 모형에서의 상대적인 영향력이 크다고 해석할 수 있다.
14와 같다. 문턱치 회귀모형이 중회귀모형 대비 Accuracy가 0.44%P 높았고, POD가 4.76%P 높아 모형의 품질이 좋아졌음을 알 수 있다. FAR 또한 문턱치 회귀모형이 중회귀모형 대비 3.
모형의 전체적인 설명력 R2는 41% 정도이며, 최종 예측인자는 중국 기상관측치의 경우 칭다오 지역의 변수만 유의하였고, 상대 적으로 거리가 먼 베이징의 경우 유의하지 않음을 확인하였다. 변수의 단위를 표준화하여 상대적인 영향력을 나타내는 표준화계수를 살펴본 결과 PM10-LPM-NOX-Tdif-VS-WS-HZ-SS-SULF 순으로 모형에서의 상대적인 영향력이 크다고 해석할 수 있다.
연속형자료인 예측치를 중앙값을 기준으로 하여 이진자료로 변환한다. 변환된 자료를 이용하여 작성된 두 이원분할표의 동일성검정을 실시하여 두 분할표가 동질적이라면 모형의 안정성이 확보되었다고 판단한다. 두 이원분할표의 동일성을 검정하기 위해 반응변수를 다항분포로 가정하는 로그선형모형 (log-linear model)을 고려하였다.
7과 같다. 선택된 최종 예측인자의 표준화계수는 PM10-NOX-LPM-VS-Tdif-WS-SULF-HZ QD 순으로 모형에서의 상대적인 영향력이 크다고 해석할 수 있다. LPM이 문턱치보다 클 때 모형적합 결과는 Table 3.
중국 기상관측치 중 베이징과 칭다오 지역에서의 연무발생, 풍속이 PM10 관측치와 유의한 상관을 가짐으로서, 중국 기상관측치 사용의 타당성을 확보하였다. 수치모델 예측치는 세 변수 (PM10, SULF, NOX) 모두 유의한 상관을 나타냈으며, 이는 수치모델 예측치 사용이 모형개발에 타당함을 나타낸다. 선택된 예측인자 (Table 3.
여섯째, 전체자료를 이용해 중회귀모형과 문턱치 회귀모형 (문턱치=120 μg/m3)을 각각 독립적으로 적합시킨다.
615로 상대적으로 큰 값을 나타낸다. 예측인자의 표준화계수의 절대값은 PM10-PS-PV-LPM 순으로 컸으며, 이를 통해 고농도 PM10 자료만 사용하여 선택된 예측인자와 중회귀모형의 예측인자 사이에 많은 차이가 있음을 확인하였다. Figure 3.
(t)는 예측인자들, PM(t)는 t시점의 PM10 농도, TH는 문턱치이다. 전날 PM10 관측치가 문턱치보다 작다면 를 예측인자로 하는 중회귀모형을 적합시키고, 전날 PM10 관측치가 문턱치보다 크거나 같다면 를 예측인자로 하는 중회귀모형을 적합한다. 이를 통해 고농도 PM10에 대한 예측의 정확도를 향상시키는데 초점을 맞추었다.
PM10 농도가 저농도일때는 큰 차이를 보이지 않는 것처럼 보이나, 고농도일때는 문턱치를 고려했을 때 예측의 정확도가 조금 향상되었음을 알 수 있다. 종합적으로 판단할 때 문턱치 회귀모형이 중회귀모형보다 향상된 결과를 보이고 있다.
1과 같다. 특별한 추세나 주기성은 나타나지 않으며, 서울 지점 최근 자료에서 고농도 PM10의 빈도가 높아짐을 확인할 수 있다. PM10 농도가 저농도에서는 예측치가 잘 맞는 것을 알 수 있으나, 고농도에서는 예측치가 과소예측되는 한계점이 있었다.
후속연구
현재 미세먼지 농도 예측을 위한 통계모형에서 예측의 정확도가 미흡한 상태이므로 더 향상된 예측품질을 위하여 향후 연구로 다양한 모형을 고려하고자 한다. 비선형 회귀모형, 다중 문턱치 모형 등 예측모형에 대한 지속적인 연구가 필요하며, 교차 상관분석을 통하여 예측인자를 추가하고자 한다.
첫째, 예측모형 개발이므로 미래시점에 대한 예측치를 생산하기 위하여 현실적으로 사용가능한 자료 들을 예측인자로 사용하여야 한다. 본 연구에서는 일일 예보시스템에 적용이 가능하도록 모형 개발을 하였다.
질의응답
핵심어
질문
논문에서 추출한 답변
대기 중 미세먼지는 어떤 영향을 주는가?
대기 중 미세먼지 (particulate matter, PM)는 대기오염의 주요원인으로 천식과 같은 호흡기계 질병의 악화, 가축의 피해, 반도체와 같은 정밀기기의 불량률 증가, 항공기 및 선박 운항제한 등 사회 · 경제 전반에서 악영향을 끼치고 있다. 미세먼지는 크기에 따라 PM10, PM2.
미세먼지는 어떻게 구분하는가?
대기 중 미세먼지 (particulate matter, PM)는 대기오염의 주요원인으로 천식과 같은 호흡기계 질병의 악화, 가축의 피해, 반도체와 같은 정밀기기의 불량률 증가, 항공기 및 선박 운항제한 등 사회 · 경제 전반에서 악영향을 끼치고 있다. 미세먼지는 크기에 따라 PM10, PM2.5, PM1 등으로 구분하며, PM10의 경우 직경이 10μm 이하인 미세먼지를 통칭한다. PM10의 발생원인은 자연적인 원인과 인위적인 원인으로 구분되며, 대부분 자동차 배기가스, 발전시설 및 공장의 배출물질과 황산염 (SO24 −), 질산염 (NO−3 ), 암모늄 (NH+4 ), 탄소화합물, 금속 화합물 등의 화학반응 과정에 의한 인위적인 원인에 의해 발생한다.
직경이 10μm 이하인 미세먼지 PM10의 발생원인은 무엇인가?
5, PM1 등으로 구분하며, PM10의 경우 직경이 10μm 이하인 미세먼지를 통칭한다. PM10의 발생원인은 자연적인 원인과 인위적인 원인으로 구분되며, 대부분 자동차 배기가스, 발전시설 및 공장의 배출물질과 황산염 (SO24 −), 질산염 (NO−3 ), 암모늄 (NH+4 ), 탄소화합물, 금속 화합물 등의 화학반응 과정에 의한 인위적인 원인에 의해 발생한다.
참고문헌 (7)
Cho, C., Chun, Y., Ku, B., Park, S., Lee, S. and Chung Y. (2007). Comparison of ADAM's(Asian Dust Aerosol Model) Results with Observed PM10 Data. Atmosphere, 17, 87-99.
Itahashi, S., Uno, I. and Kim, S. (2012). Source Contributions of Sulfate Aerosol over East Asia Estimated by CMAQ-DDM. Environmental Science & Technology, 46, 6733-6741.
Jeong, K. M. and Choi, Y. S. (2009). Categorical Data Analysis Using SAS, Free Academy, Seoul.
Moon, N., Kim, S., Byun, D. W. and Joe, Y. (2006). Air Quality Modeling System I-Development of Emissions Preparation System with the CAPSS, Korea Environment Institute.
Murphy, A. H. (1993). What is Good Forecast? An Essay on the Nature of Goodness in Weather Forecasting. Weather and Forecasting, 8, 281-293.
Storch, H. V. and Zwiers, F. W. (1999). Statistical Analysis in Climate Research, Cambridge, Cambridge University Press, Cambridge.
Tong, H. (1983). Threshold Models in Non-linear Time Series Analysis, Springer, New York.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.