최근 국내에서는 다양한 이상기후들이 발생하고 있으며 이로 인해 인명피해, 재산피해와 같은 큰 피해들이 발생하고 있다. 그 중에서도 폭염으로 인한 피해는 점점 증가하는 경향을 보인다. 이에 대처하기 위해서는 빠르고 정확한 기온 및 폭염발생여부 예측이 필수적이다. 현재 기상청에서는 폭염에 대한 정보를 단기예보를 통해 제공하는데, 단기예보를 위한 기온예측은 수치예보모델을 통해 수행된다. 과거 15년간(1998~2012년) 인구대비 폭염 사망률이 가장 높았던 ◯◯군에 대하여 2019년도 기온 예보자료와 관측 자료를 비교한 결과, 평균제곱근오차가 1.57℃ 발생하였고, 관측 값이 33℃이상에 해당하는 데이터만 비교한 결과, 평균제곱근오차가 1.96℃ 발생하였다. 예보시간은 4시간이고 예보과정에는 약 3~4시간이 소요된다. 이에 본 연구에서는 소요시간과 예측 정확도를 고려하여, 기계학습방법의 일종인 LSTM을 이용한 기온 및 폭염발생 예측 방법론을 제시한다. 기계학습모델을 이용한 4시간 기온예측결과 1.71℃의 평균제곱근오차가 발생하였고, 관측 값이 33℃ 이상에 해당하는 데이터만 비교한 결과 1.39℃의 평균제곱근오차가 발생하였다. 전 범위의 오차는 수치예보모델이 더 작은 값을 가지지만, 33℃이상의 경우에는 기계학습모델 예측의 정확도가 더 높았다. 또한 수치예보를 이용한 경우 예상 소요시간이 4시간가량인 반면 기계학습을 이용한 기온예측에는 평균 9분26초의 시간이 소요되어 경제적이라 판단하였다. 향후 공간적인 범위를 확대하거나 대상 지역을 변경하는 일반적인 방안에 대해서 연구를 수행하고자 한다.
최근 국내에서는 다양한 이상기후들이 발생하고 있으며 이로 인해 인명피해, 재산피해와 같은 큰 피해들이 발생하고 있다. 그 중에서도 폭염으로 인한 피해는 점점 증가하는 경향을 보인다. 이에 대처하기 위해서는 빠르고 정확한 기온 및 폭염발생여부 예측이 필수적이다. 현재 기상청에서는 폭염에 대한 정보를 단기예보를 통해 제공하는데, 단기예보를 위한 기온예측은 수치예보모델을 통해 수행된다. 과거 15년간(1998~2012년) 인구대비 폭염 사망률이 가장 높았던 ◯◯군에 대하여 2019년도 기온 예보자료와 관측 자료를 비교한 결과, 평균제곱근오차가 1.57℃ 발생하였고, 관측 값이 33℃이상에 해당하는 데이터만 비교한 결과, 평균제곱근오차가 1.96℃ 발생하였다. 예보시간은 4시간이고 예보과정에는 약 3~4시간이 소요된다. 이에 본 연구에서는 소요시간과 예측 정확도를 고려하여, 기계학습방법의 일종인 LSTM을 이용한 기온 및 폭염발생 예측 방법론을 제시한다. 기계학습모델을 이용한 4시간 기온예측결과 1.71℃의 평균제곱근오차가 발생하였고, 관측 값이 33℃ 이상에 해당하는 데이터만 비교한 결과 1.39℃의 평균제곱근오차가 발생하였다. 전 범위의 오차는 수치예보모델이 더 작은 값을 가지지만, 33℃이상의 경우에는 기계학습모델 예측의 정확도가 더 높았다. 또한 수치예보를 이용한 경우 예상 소요시간이 4시간가량인 반면 기계학습을 이용한 기온예측에는 평균 9분26초의 시간이 소요되어 경제적이라 판단하였다. 향후 공간적인 범위를 확대하거나 대상 지역을 변경하는 일반적인 방안에 대해서 연구를 수행하고자 한다.
Climate variations have become worse and diversified recently, which caused catastrophic disasters for our communities and ecosystem including economic property damages in Korea. Heat wave of summer season is one of causes for such damages of which outbreak tends to increase recently. Related short-...
Climate variations have become worse and diversified recently, which caused catastrophic disasters for our communities and ecosystem including economic property damages in Korea. Heat wave of summer season is one of causes for such damages of which outbreak tends to increase recently. Related short-term forecasting information has been provided by the Korea Meteorological Administration based on results from numerical forecasting model. As the study area, the ◯◯ province was selected because of the highest mortality rate in Korea for the past 15 years (1998~2012). When comparing the forecasted temperatures with field measurements, it showed RMSE of 1.57℃ and RMSE of 1.96℃ was calculated when only comparing the data corresponding to the observed value of 33℃ or higher. The forecasting process would take at least about 3~4 hours to provide the 4 hours advanced forecasting information. Therefore, this study proposes a methodology for temperature prediction using LSTM considering the short prediction time and the adequate accuracy. As a result of 4 hour temperature prediction using this approach, RMSE of 1.71℃ was occurred. When comparing only the observed value of 33℃ or higher, RMSE of 1.39℃ was obtained. Even the numerical prediction model of the whole range of errors is relatively smaller, but the accuracy of prediction of the machine learning model is higher for above 33℃. In addition, it took an average of 9 minutes and 26 seconds to provide temperature information using this approach. It would be necessary to study for wider spatial range or different province with proper data set in near future.
Climate variations have become worse and diversified recently, which caused catastrophic disasters for our communities and ecosystem including economic property damages in Korea. Heat wave of summer season is one of causes for such damages of which outbreak tends to increase recently. Related short-term forecasting information has been provided by the Korea Meteorological Administration based on results from numerical forecasting model. As the study area, the ◯◯ province was selected because of the highest mortality rate in Korea for the past 15 years (1998~2012). When comparing the forecasted temperatures with field measurements, it showed RMSE of 1.57℃ and RMSE of 1.96℃ was calculated when only comparing the data corresponding to the observed value of 33℃ or higher. The forecasting process would take at least about 3~4 hours to provide the 4 hours advanced forecasting information. Therefore, this study proposes a methodology for temperature prediction using LSTM considering the short prediction time and the adequate accuracy. As a result of 4 hour temperature prediction using this approach, RMSE of 1.71℃ was occurred. When comparing only the observed value of 33℃ or higher, RMSE of 1.39℃ was obtained. Even the numerical prediction model of the whole range of errors is relatively smaller, but the accuracy of prediction of the machine learning model is higher for above 33℃. In addition, it took an average of 9 minutes and 26 seconds to provide temperature information using this approach. It would be necessary to study for wider spatial range or different province with proper data set in near future.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
, 2017). 그러나 지역별로 폭염으로 인한 영향에는 차이가 있으며 이에 본 연구에서는 인구대비 폭염 사망률이 가장 높은 지역으로 기온예측을 수행하였고 4시간 예측을 통해 오차를 최소화하고자 하였다. 예보업무규정 부칙 제 17조에 따르면 현재 국내 폭염특보발표기준은 폭염주의보와 폭염경보가 있으며 폭염주의보는 일 최고기온 33°C 이상인 상태가 2일 이상 지속될 것으로 예상될 경우, 폭염경보는 일 최고기온 35°C 이상인 상태가 2일 이상 지속될 것으로 예상될 경우 발령한다(KMA, 2019).
본 연구에서는 기계학습을 이용한 기온예측모델을 제안한다. 기계학습의 학습방법으로는 지도학습, 비지도 학습, 강화학습이 있다.
본 연구에서는 예측하고자 하는 값이 기온이므로 기온과 각 변수들과의 관계의 선형성을 확인하기 위하여 상관성 분석을 수행하였다. Table 1은 상관성분석의 결과이며 각 값은 상관계수이다.
기온예측에 소요되는 계산 시간을 단축시킨다면 기상예보 및 피해예방에 도움이 될 것이다. 이에 본 연구에서는 기계학습을 이용하여 수치예보모델보다 계산 시간이 짧고, 데이터 가공 과정이 불필요한 기온예측 방법론을 제시하고자 한다. 국내외로 기계학습을 이용한 기후예측모델에 관한 연구는 수차례 수행된 바 있다.
제안 방법
기계학습의 매개변수로는 학습률(Learning rate), 시퀀스길이(Sequence length), 은닉 층(Hidden layer), 반복횟수(Iteration)를 사용하였다. 시퀀스는 데이터에 번호를 지정하여 나열한 것이며 시퀀스길이는 한 번에 몇 개의 데이터를 이용하여 예측을 수행할 것인지를 지정하는 변수이다.
두 번째 경우 관측 값이 폭염주의보 기준인 33°C이상인 값들만 분석하였다.
이처럼 폭염 대비를 위한 기온예측에서 가장 중요한 것은 정확도이다. 따라서 본 연구에서는 기온예측모델의 정확도를 우선적으로 고려하였고 결과의 정확도를 분석하여 수치예보모델을 이용한 기온예측의 정확도와 비교하였다. 본 연구에서 제안하는 기온예측 모델은 과거의 데이터를 이용하여 미래의 데이터를 예측한다.
이는 데이터를 수신하여 분석자료를 출력하고 기상예보관의 분석을 거치는 단계까지 비교적 복잡한 과정을 거치며 3~4시간 이상의 시간이 소요되는 반면, 본 연구의 기온예측은 사람의 분석과정이 없는 간단한 과정과 약 10분정도의 짧은 소요시간만을 필요로 한다. 본 모델의 4시간 기온예측 결과의 오차는 두 가지 경우로 나누어 분석하였다. 첫 번째 경우 전체 데이터의 오차를 분석한 결과는 기계학습모델이 약 1.
따라서 본 연구에서는 기온예측모델의 정확도를 우선적으로 고려하였고 결과의 정확도를 분석하여 수치예보모델을 이용한 기온예측의 정확도와 비교하였다. 본 연구에서 제안하는 기온예측 모델은 과거의 데이터를 이용하여 미래의 데이터를 예측한다. 과거의 입력 값과 결과 값의 패턴을 분석하고 이를 학습하여 현재 시점의 입력 값을 제공하였을 때 분석한 패턴에 맞게 결과 값을 출력한다.
본 연구에서는 4시간 예측을 수행하였다. ○○군의 2010년도부터 2018년도까지 9년간의 여름(6월~8월)의 시간 단위 기상자료와 각 시간별 4시간 후의 기온을 입력하여 이를 학습 데이터 셋으로 사용하였다.
본 연구에서는 기계학습 중에서도 LSTM을 이용하여 국내 ○○도 ○○군의 4시간 후의 기온예측을 수행하였다. 해당 지역의 2010-2018년도의 여름철 기상자료들을 이용하여 2019년도의 기온을 예측하였으며 다양한 오차지표를 이용하여 예측의 정확도를 검토하였다.
상관계수가 양수일 경우 두 변수는 양의 상관관계를, 상관계수가 음수일 경우에는 음의상관관계를 가지며, 절댓값이 클수록 상관성도 크다고 볼 수 있다. 본 연구에서는 기온, 강수량, 풍속, 습도, 증기압, 일사량이 모두 유의하다고 판단하였고, 각 변수들과 기온과의 상관성 분석을 수행하였다. 이후, 기온예측모델에서 사용하는 매개변수들의 최적조건을 찾기 위해 매개변수의 값을 다르게 하여 몇 가지 경우를 설정하였다.
집단을 대표할 수 있는 값인 평균을 비교하여 두 집단 간의 차이를 보고 평균차이가 유의미한 차이인지를 판단한다. 본 연구에서는 폭염발생여부를 기준으로 기상변수를 각각 두 집단으로 나누었다. 기온 관측 자료가 폭염발생기준인 33°C 이상의 값을 가진 경우와 33°C미만의 값을 가진 경우의 두 가지 집단으로 나누었으며, 각 기상변수별로 두 집단 간의 T-test를 통하여 자료의 유의성을 판단하였다.
이후, 기온예측모델에서 사용하는 매개변수들의 최적조건을 찾기 위해 매개변수의 값을 다르게 하여 몇 가지 경우를 설정하였다. 설정한 경우대로 매개변수의 값을 입력하고 모델을 실행시켜 각 경우마다 오차를 분석하고 오차가 가장 작은 경우를 매개변수의 최적조건으로 선정하였다. 이를 통해 찾은 매개변수의 최적 값을 입력하고 모델을 실행시켜 도출한 결과가 최종 예측데이터이다.
검증 데이터 셋은 최근의 기상자료들과 일정시간 후의 기온을 포함한다. 이를 이용하여 모델을 실행하면 모델은 학습 데이터셋의 기상자료들이 일정시간 후의 기온을 형성하기까지 어떤 패턴을 이루는지를 분석하고 이를 학습한다. 그 후 검증 데이터셋의 기상자료에 학습한 패턴을 적용하여 일정시간 후의 기온을 예측하고, 이를 이미 입력되어있던 기온 데이터와 비교하여 모델 자체적으로 정확도를 검토하며 반복계산을 통해 오차를 줄여나간다(Fig.
최종 데이터의 정확도를 검토를 위해 오차지표 RMSE(Root Mean Square Error), MAE(Mean Absolute Error), R²를 이용하였다. 이와 같은 과정을 거쳐 도출해낸 최적 조건에서의 기온예측 결과와 수치예보모델을 이용한 기온예측 결과의 정확도를 비교하였다.
본 연구에서는 기온, 강수량, 풍속, 습도, 증기압, 일사량이 모두 유의하다고 판단하였고, 각 변수들과 기온과의 상관성 분석을 수행하였다. 이후, 기온예측모델에서 사용하는 매개변수들의 최적조건을 찾기 위해 매개변수의 값을 다르게 하여 몇 가지 경우를 설정하였다. 설정한 경우대로 매개변수의 값을 입력하고 모델을 실행시켜 각 경우마다 오차를 분석하고 오차가 가장 작은 경우를 매개변수의 최적조건으로 선정하였다.
T-test는 두 집단의 평균을 비교하는 검정 방법이다. 집단을 대표할 수 있는 값인 평균을 비교하여 두 집단 간의 차이를 보고 평균차이가 유의미한 차이인지를 판단한다. 본 연구에서는 폭염발생여부를 기준으로 기상변수를 각각 두 집단으로 나누었다.
본 연구에서는 기계학습 중에서도 LSTM을 이용하여 국내 ○○도 ○○군의 4시간 후의 기온예측을 수행하였다. 해당 지역의 2010-2018년도의 여름철 기상자료들을 이용하여 2019년도의 기온을 예측하였으며 다양한 오차지표를 이용하여 예측의 정확도를 검토하였다. 현재 기상청에서는 수치예보모델을 이용하여 기상예보를 실시한다.
대상 데이터
본 연구에서는 4시간 예측을 수행하였다. ○○군의 2010년도부터 2018년도까지 9년간의 여름(6월~8월)의 시간 단위 기상자료와 각 시간별 4시간 후의 기온을 입력하여 이를 학습 데이터 셋으로 사용하였다. 검증 데이터 셋으로는 2019년도의 6월부터 8월까지의 기상자료와 4시간 후의 기온을 입력한 자료를 사용하였다.
○○군의 2010년도부터 2018년도까지 9년간의 여름(6월~8월)의 시간 단위 기상자료와 각 시간별 4시간 후의 기온을 입력하여 이를 학습 데이터 셋으로 사용하였다. 검증 데이터 셋으로는 2019년도의 6월부터 8월까지의 기상자료와 4시간 후의 기온을 입력한 자료를 사용하였다. 기상자료로는 기온, 강수량, 풍속, 습도, 증기압, 일사량자료를 수집하였고, t-test를 수행하여 각 기상변수의 기온예측과정에서의 유의성을 판단하였다.
본 연구에서의 학습 데이터 셋은 과거 수년간의 기상자료들과 그로부터 일정 시간 후의 기온을 포함한다. 검증 데이터 셋은 최근의 기상자료들과 일정시간 후의 기온을 포함한다. 이를 이용하여 모델을 실행하면 모델은 학습 데이터셋의 기상자료들이 일정시간 후의 기온을 형성하기까지 어떤 패턴을 이루는지를 분석하고 이를 학습한다.
또한 예측의 정확도 검토를 위한 비교자료는 2019년 여름철 기상자료를 이용하였으며, 4시간 후의 기온예측을 수행하였다. 기상자료는 기온, 강수량, 풍속, 습도, 증기압, 일사량 데이터를 이용하였다.
기계학습모델을 통한 예측은 데이터의 스케일이 클수록 극값 예측에 대한 정확도가 저하되는 경향을 보였다. 따라서 1년의 기온데이터를 이용하는 대신 여름철의 기온데이터만을 사용하였다. 또한, 33°C 이하보다 33°C 이상에서 더 높은 정확도를 나타내었는데, 이는 33°C 이하보다 33°C 이상 데이터의 스케일이 작기 때문이라고 판단하였다.
기상청에서 제공하는 기상관측자료는 시군구 단위로 제공되고 단기예보자료는 읍면리 단위까지 제공된다. 따라서 관측 자료는 ○○군의 자료를 수집하였고 예보자료는 ○○군에 속한 읍, 면별로 자료를 수집하였다. ○○군에는○○읍을 포함하여 총13개의 읍과 면이 포함되어 있다.
, 2017). 따라서 기온예측을 위한 과거 기상자료는 2010년부터 2018년까지 9년간의 여름철의 자료를 이용하였다. 또한 예측의 정확도 검토를 위한 비교자료는 2019년 여름철 기상자료를 이용하였으며, 4시간 후의 기온예측을 수행하였다.
, 2016). 따라서 대상지역을 ○○군으로 선정하였다. 또한 우리나라 여름철(6~8월) 평균기온은 1979년 이후 현재까지 강한 변동성과 함께 증가하는 추세를 보이며, 여름철 기온의 중요성이 강조되고 있다(Won et al.
따라서 기온예측을 위한 과거 기상자료는 2010년부터 2018년까지 9년간의 여름철의 자료를 이용하였다. 또한 예측의 정확도 검토를 위한 비교자료는 2019년 여름철 기상자료를 이용하였으며, 4시간 후의 기온예측을 수행하였다. 기상자료는 기온, 강수량, 풍속, 습도, 증기압, 일사량 데이터를 이용하였다.
모델을 실행시키기 위해 입력해야하는 과거 데이터로는 학습 데이터 셋(train set)과 검증 데이터셋(test set)이 있다. 본 연구에서의 학습 데이터 셋은 과거 수년간의 기상자료들과 그로부터 일정 시간 후의 기온을 포함한다. 검증 데이터 셋은 최근의 기상자료들과 일정시간 후의 기온을 포함한다.
본 연구의 기계학습모델은 ○○군을 대상으로 한 기온예측을 수행하였다. 따라서 ○○군이 아닌 다른 지역의 기온예측을 수행한다면 정확도가 저하될 가능성이 있다.
데이터처리
검증 데이터 셋으로는 2019년도의 6월부터 8월까지의 기상자료와 4시간 후의 기온을 입력한 자료를 사용하였다. 기상자료로는 기온, 강수량, 풍속, 습도, 증기압, 일사량자료를 수집하였고, t-test를 수행하여 각 기상변수의 기온예측과정에서의 유의성을 판단하였다. 유의하다고 판단된 변수는 예측하고자하는 데이터인 기온과의 관계를 분석하기위해 상관성분석을 수행하였다.
기온 관측 자료가 폭염발생기준인 33°C 이상의 값을 가진 경우와 33°C미만의 값을 가진 경우의 두 가지 집단으로 나누었으며, 각 기상변수별로 두 집단 간의 T-test를 통하여 자료의 유의성을 판단하였다.
기상자료로는 기온, 강수량, 풍속, 습도, 증기압, 일사량자료를 수집하였고, t-test를 수행하여 각 기상변수의 기온예측과정에서의 유의성을 판단하였다. 유의하다고 판단된 변수는 예측하고자하는 데이터인 기온과의 관계를 분석하기위해 상관성분석을 수행하였다. 상관계수가 양수일 경우 두 변수는 양의 상관관계를, 상관계수가 음수일 경우에는 음의상관관계를 가지며, 절댓값이 클수록 상관성도 크다고 볼 수 있다.
최종 데이터의 정확도를 검토를 위해 오차지표 RMSE(Root Mean Square Error), MAE(Mean Absolute Error), R²를 이용하였다.
이론/모형
본 연구 대상인 폭염여부를 결정하는 기온와 같이 과거의 정보를 기반으로 하고 현재의 정보를 이용하여 미래의 결과를 도출하고자 하는 연구에서는 이러한 장기적 기억이 필수적이다. 따라서 본 연구에서는 LSTM을 이용하여 기계학습을 수행하였다.
상관계수가 양수일 경우 두 변수는 양의 상관관계를, 상관계수가 음수일 경우에는 음의상관관계를 가지며, 절댓값이 클수록 뚜렷한 상관관계를 가진다고 볼 수 있다. 상관계수를 판단하는 기준에는 피어슨 상관계수, 스피어만 상관계수 등 다양한 기준이 존재하며, 본 연구에서의 해석에는 보편적으로 사용되는 피어슨 상관계수를 적용하였다.
성능/효과
1사이일 경우 거의 무시될 수 있는 선형관계임을 의미한다. 강수량과 기온과의 선형성은 비교적 낮으며 일사량과 기온과의 상관성이 높은 양의 상관관계를 가지고 있음을 확인할 수 있다. 강수량을 제외하고 나머지 변수들은 모두 기온과 뚜렷한 선형관계를 가진다.
그 결과 수치예보모델의 오차는 RMSE 1.96°C, MAE 1.72°C, 기계학습모델의 오차는 RMSE 1.39°C, MAE 0.92°C의 값을 가지며 수치예보모델보다 높은 정확도를 나타냄을 확인할 수 있었다.
39°C로 더욱 낮은 오차가 발생하였다. 기계학습모델을 통한 예측은 데이터의 스케일이 클수록 극값 예측에 대한 정확도가 저하되는 경향을 보였다. 따라서 1년의 기온데이터를 이용하는 대신 여름철의 기온데이터만을 사용하였다.
05이하이면 그 변수는 유의하다고 판정할 수 있다. 기계학습에 입력 값으로 사용할 기상변수인 기온, 강수량, 풍속, 습도, 증기압, 일사량을 대상으로 t-test를 수행한 결과, 모든 기상변수의 p-value 값이 약 2.2e-16으로 판정되었다. 따라서 모든 변수들이 유의하다고 판단하였으며 모든 변수를 기온예측에 사용하였다.
기계학습모델에서 위로 뻗은 막대의 길이가 아래로 뻗은 막대보다 긴 반면, 수치예보모델에서는 위·아래 막대의 길이가 같으며 다른 형태의 분포를 보인다. 또한 기계학습모델의 제1,2,3 사분위수가 각각 수치예보모델의 제1,2,3 사분위수보다 큰 값임을 확인할 수 있는데 이는 동일한 관측 값 범위에서 기계학습모델이 수치예보모델보다 큰 값으로 예측하였음을 의미하므로 기계학습을 이용한 예측이 더욱 보수적이라고 판단할 수 있다.
모델실행 결과, Learning rate=0.005, Sequence length=8, Hidden layer=20, Iteration=2000일 경우에 RMSE, MAE값이 가장 작고 R² 값이 가장 크게 산정되었다.
본 연구에서 제안한 기계학습 모델을 통한 기온예측은 폭염대비를 목적으로 하므로, 폭염 주의보 발령기준인 33°C이상의 데이터에서 수치예보모델을 이용한 기온예측보다 높은 정확도를 나타낸다는 것은 매우 유의미한 결과라고 판단할 수 있다.
Table 1은 상관성분석의 결과이며 각 값은 상관계수이다. 상관계수의 해석에는 보편적으로 쓰이는 피어슨 상관계수를 사용하였는데 상관계수가 0.3에서 0.7사이일 경우 뚜렷한 양적 선형관계임을, 상관계수가 -0.7과 -0.3 사이일 경우 뚜렷한 음의 상관관계를 가진다. 또한 상관계수가 -0.
그러나 예보 소요시간 측면에서 큰 차이를 보임을 확인할 수 있다. 수치예보모델을 이용한 예측의 소요시간을 3시간이라고 가정했을 때, 기계학습모델을 이용한 예측의 소요시간은 9분26초로 94.79%의 큰 감소율을 보였다. Table 5는 관측 값이 33°C이상인 경우 두 모델의 기온예측 오차를 나타낸 표이다.
전범위의 오차는 수치예보모델이 더 작은 값을 가진 반면, 33°C 이상의 경우에는 기계학습모델을 통한 예측이 더 작은 오차를 가지며 높은 정확도를 보였다.
최적조건은 오차지표인 RMSE 와 MAE, R²를 이용하여 오차가 가장 적은 경우를 최적의 조건이라고 판단하였다.
후속연구
이를 이용하여 모델을 실행하면 모델은 학습 데이터셋의 기상자료들이 일정시간 후의 기온을 형성하기까지 어떤 패턴을 이루는지를 분석하고 이를 학습한다. 그 후 검증 데이터셋의 기상자료에 학습한 패턴을 적용하여 일정시간 후의 기온을 예측하고, 이를 이미 입력되어있던 기온 데이터와 비교하여 모델 자체적으로 정확도를 검토하며 반복계산을 통해 오차를 줄여나간다(Fig. 1).
따라서 ○○군이 아닌 다른 지역의 기온예측을 수행한다면 정확도가 저하될 가능성이 있다. 따라서 향후 지역별 기온 차이에 대한 검토를 수행하고 이를 반영할 수 있는 요소를 포함하여 국내 모든 지역에 적용할 수 있는 보편적 모델을 개발한다면 기온예측모델의 효율성이 크게 증가될 것이라 기대한다. 또한 본 모델을 이용하여 4시간 예측을 수행하는데 있어서 8% 이내의 오차가 발생하였는데 향후, 이와 같은 수준의 정확도를 유지하며 12시간, 24시간 등으로 예측시간 증가가 가능하다면 폭염에 대하여 더욱 빠르고 철저한 대처가 가능할 것이라 기대한다.
따라서 향후 지역별 기온 차이에 대한 검토를 수행하고 이를 반영할 수 있는 요소를 포함하여 국내 모든 지역에 적용할 수 있는 보편적 모델을 개발한다면 기온예측모델의 효율성이 크게 증가될 것이라 기대한다. 또한 본 모델을 이용하여 4시간 예측을 수행하는데 있어서 8% 이내의 오차가 발생하였는데 향후, 이와 같은 수준의 정확도를 유지하며 12시간, 24시간 등으로 예측시간 증가가 가능하다면 폭염에 대하여 더욱 빠르고 철저한 대처가 가능할 것이라 기대한다.
질의응답
핵심어
질문
논문에서 추출한 답변
기계학습의 학습방법으로는 무엇이 있는가?
본 연구에서는 기계학습을 이용한 기온예측모델을 제안한다. 기계학습의 학습방법으로는 지도학습, 비지도 학습, 강화학습이 있다. 본 연구에서는 지도학습방법을 적용하였는데 이는 입력된 데이터에 대한 답이 주어진 상태에서 학습시키는 방법이다.
지도학습방법이란 무엇인가?
기계학습의 학습방법으로는 지도학습, 비지도 학습, 강화학습이 있다. 본 연구에서는 지도학습방법을 적용하였는데 이는 입력된 데이터에 대한 답이 주어진 상태에서 학습시키는 방법이다. 지도학습은 분류와 회귀로 나뉘는데, 분류는 데이터가 주어졌을 때 데이터의 카테고리를 판단하는 방식이며 회귀는 데이터가 주어졌을 때 이의 특징을 기반으로 하여 연속된 값을 예측하는 방식이다.
예보관의 데이터 가공 과정이 필수적인 이유는 무엇인가?
기상청의 기상예보는 관측 장비로부터 온도, 습도 등 대기 상태의 관측 값을 수신하여 수치예보모델을 통해 분석 자료를 만들어내고, 이를 예보관이 분석하여 발표하는 과정으로 이루어진다. 이 과정에서 데이터를 수신하여 자료동화 하는데 약 2~3시간이 소요되며 수치예보모델을 통해 분석 자료를 만드는데 약 1시간 정도 소요된다(KMA, 2018). 이에 더하여 예보관의 분석과정에도 시간이 소요되며 이는 예보관에 따라 차이가 있다. 따라서 기상예보까지 최소 3~4시간이 소요되며 예보관의 데이터 가공 과정이 필수적이다.
참고문헌 (17)
Ahn, J. and Jeong, C. (2018). Numerical Simulation of the Flood Event Induced Temporally and Spatially Concentrated Rainfall - On August 17, 2017, the Flood Event of Cheonggyecheon. Journal of Korean Society of Disaster and Security. 11(2): 45-52.
Choi, J. (2019). Proposal of Early-Warning Criteria for Highway Debris Flow Using Rainfall Frequency (1): Proposal of Rainfall Criteria. Journal of Korean Society of Disaster and Security. 12(2): 1-13.
Choi, M. H. and Yun, J. I. (2009). On Recent Variations in Solar Radiation and Daily Maximum Temperature in Summer. Korean Journal of Agricultural and Forest Meteorology. 11(4): 185-191.
Joints of Related Ministries (2018) Abnormal Weather Report. Seoul: Korea Meteorological Administration.
Kim, J., Lee, D. G., Park, I. S., Choi, B. C., and Kim, J. S. (2006). Influences of Heat Waves on Daily Mortality in South Korea. Atmosphere. 16(4): 269-278.
Korea Meteorological Administration (2018). Evaluation of Contribution of Meteorological Observation Data to Weather Forecasts. Seoul: Korea Meteorological Administration.
Korea Meteorological Administration (2019). Forecast Services Regulations APPENDUM Article17. Seoul: Korea Meteorological Administration.
Korea Meteorological Administration (2019). A Study on the Diagnosis and Development Direction of the Forecasting System. Seoul: Korea Meteorological Administration.
Lee, S. G., Jung, S. G., Lee, W. S., and Park, G. H. (2011). A Predictive Model for Urban Temperature Using the Artificial Neural Network. Korea Planners Association. 46(1): 129-142.
Park, J.E., Heo, B.Y., and Sunwoo, Y. (2016). A Study on Human Damage due to Heat Wave by Region. Journal of the Korean Society of Hazard Mitigation. 16(1): 103-109.
Qing, X. and Niu, Y. (2018). Hourly Day-ahead Solar Irradiance Prediction Using Weather Forecasts by LSTM. Energy. 148: 461-468.
Sharma, N., Sharma, P., Irwin, D., and Shenoy, P. (2011). Predicting Solar Generation from Weather Forecasts Using Machine Learning. In 2011 IEEE International Conference on Smart Grid Communications (SmartGridComm). 528-533.
Won, Y. J., Yeh, S. W., Yim, B. Y., and Kim, H. K. (2017). Relationship between Korean Monthly Temperature during Summer and Eurasian Snow Cover during Spring. Atmosphere. 27(1): 55-65.
Yoo, H., Lee, S. O., Choi, S., and Park, M. (2019). A Study on the Data Driven Neural Network Model for the Prediction of Time Series Data: Application of Water Surface Elevation Forecasting in Hangang River Bridge. Journal of Korean Society of Disaster and Security. 12(2): 73-82.
Yoon, J.W. and Jeon, M.G. Temperature Forecasting Model by Using Deep Learning Technology based on LSTM. Proceeding of Institute of Electronics and Information Engineers Conference. 912-915.
Zhang, Q., Wang, H., Dong, J., Zhong, G., and Sun, X. (2017). Prediction of Sea Surface Temperature Using Long Short-term Memory. IEEE Geoscience and Remote Sensing Letters. 14(10): 1745-1749.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.