고해상도 격자 단위 기후정보는 농업, 관광학, 생태학, 질병학 등 다양한 분야의 현상을 설명하는 중요 요인이다. 고해상도 기후정보는 동적 모형과 통계적 모형을 통해 얻을 수 있다. 통계적 모형은 동적 모형에 비해 계산 시간이 저렴하여 시공간 해상도가 높은 기후자료 생성에 주로 이용한다. 본 연구에서는 2003년부터 2012년까지 1월에 관측된 일 평균기온자료를 토대로 통계적 모형의 일 평균 기온을 생성하였다. 통계적 모형으로 선형모형을 기반으로한 일반선형모형, 일반화가법모형, 공간선형모형, 베이지안공간선형모형을 고려하였다. 예측성능평가를 위해 60개소의 지상관측소에서 관측된 일 평균기온을 모형적합 자료로 사용하여 352개소의 자동기상관측의 일 평균기온을 검증하였다. 평균제곱오차와 상관계수를 보면 베이지안공간모형의 예측성능이 다른 모형에 비해 상대적으로 우수하였다. 최종적으로 $1km{\times}1km$ 격자 단위 일 평균기온 지도를 생성하였다.
고해상도 격자 단위 기후정보는 농업, 관광학, 생태학, 질병학 등 다양한 분야의 현상을 설명하는 중요 요인이다. 고해상도 기후정보는 동적 모형과 통계적 모형을 통해 얻을 수 있다. 통계적 모형은 동적 모형에 비해 계산 시간이 저렴하여 시공간 해상도가 높은 기후자료 생성에 주로 이용한다. 본 연구에서는 2003년부터 2012년까지 1월에 관측된 일 평균기온자료를 토대로 통계적 모형의 일 평균 기온을 생성하였다. 통계적 모형으로 선형모형을 기반으로한 일반선형모형, 일반화가법모형, 공간선형모형, 베이지안공간선형모형을 고려하였다. 예측성능평가를 위해 60개소의 지상관측소에서 관측된 일 평균기온을 모형적합 자료로 사용하여 352개소의 자동기상관측의 일 평균기온을 검증하였다. 평균제곱오차와 상관계수를 보면 베이지안공간모형의 예측성능이 다른 모형에 비해 상대적으로 우수하였다. 최종적으로 $1km{\times}1km$ 격자 단위 일 평균기온 지도를 생성하였다.
Climate information of the high resolution grid units is an important factor to explain the phenomenon in a variety of research field. Statistical linear interpolation models are computationally inexpensive and applicable to any climate data compared to the dynamic simulation method at regional scal...
Climate information of the high resolution grid units is an important factor to explain the phenomenon in a variety of research field. Statistical linear interpolation models are computationally inexpensive and applicable to any climate data compared to the dynamic simulation method at regional scales. In this paper, we considered four different linear-based statistical interpolation models: general linear model, generalized additive model, spatial linear regression model, and Bayesian spatial linear regression model. The climate variable of interest was the daily mean temperature, where the spatial variability was explained using geographic terrain information: latitude, longitude, elevation. The data were collected by weather stations in January from 2003 and 2012. In the sense of RMSE and correlation coefficient, Bayesian spatial linear regression model showed better performance in reflecting the spatial pattern compared to the other models.
Climate information of the high resolution grid units is an important factor to explain the phenomenon in a variety of research field. Statistical linear interpolation models are computationally inexpensive and applicable to any climate data compared to the dynamic simulation method at regional scales. In this paper, we considered four different linear-based statistical interpolation models: general linear model, generalized additive model, spatial linear regression model, and Bayesian spatial linear regression model. The climate variable of interest was the daily mean temperature, where the spatial variability was explained using geographic terrain information: latitude, longitude, elevation. The data were collected by weather stations in January from 2003 and 2012. In the sense of RMSE and correlation coefficient, Bayesian spatial linear regression model showed better performance in reflecting the spatial pattern compared to the other models.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 지리정보시스템 (geographic information system; GIS) 정보를 입력변수로 활용한 통계적 모형을 통해 1km× 1km 격자 단위 일 평균 기후정보를 생성하는 방법을 다루고자 한다. Kim 등 (2012)에 따르면 남한에 설치된 76개의 지상관측소 (automated surface observing system; ASOS)와 450개의 자동기상관측소 (automatic weather station; AWS)에서 얻은 기상관측자료를 통해 약 12km의 격자 단위 기후정보가 생산될 수 있다고 한다.
가설 설정
4이다. SLM과 BSM은 기상관측소 주변의 신뢰구간이 다른 지역에 비해 상대적으로 작다. 반면 GLM과 GAM은 지형학적요인(위도, 경도, 고도)으로 평균기온을 예측하므로 고도에 많은 영향을 받고있다.
제안 방법
고해상도 격자단위 기후자료 생성을 위해 모든 기상관측소 (60개+352개=412개)의 위치정보 (위도, 경도, 고도)와 관측된 일 평균기온 자료를 통계 모형에 적합시켜 GTOPO30에서 얻어진 1km 해상도 격자 (위도, 경도, 고도)의 평균기온을 예측하였다. 예를 들어 2007년 1월 15일 고해상도 (1km × 1km) 격자 단위 평균기온은 Figure 3.
본 연구에서는 선형모형을 기반으로 한 통계모형을 이용하여 고해상도 격자 단위 기후자료를 생성하였다. ASOS에서 관측된 평균기온 자료로 AWS에서 관측된 평균기온 자료를 예측하여 관측된 평균기온값과 비교한 결과 다른 통계모형에 비해 BSM의 RMSE가 낮고 상관계수가 높았다.
선형모형을 기반으로 한 통계적 모형은 이해하기 쉬운 직관적 모형으로 다른 모형에 비해 상대적으로 쉽게 지형학적 요인이 기후정보에 미치는 영향을 확인할 수 있다. 본 연구에서는 선형모형을 기반으로 한 통계적 모형으로 일반선형모형, 일반화가법모형, 공간선형모형 그리고 베이지안 공간선형모형을 고려하여 고해상도 격자 단위 기후정보를 예측하고 그 예측성능을 비교하였다. 2절에서 선형모형 기반의 통계적 모형을 설명하고 3절에서 통계적 모형간 예측성능을 평가하였다.
통계모형의 예측성능을 정량적으로 평가하기 위해 2003년부터 2012년까지 AWS에서 관측된 일 평균기온과 예측된 일 평균기온의 RMSE, rBias 그리고 상관계수를 연도별로 살펴보았다 (Table 3.1). 분석 결과는 일별 평가척도의 평균이다.
대상 데이터
통계모형의 독립변수로 이용된 지형 자료는 위도, 경도, 고도이다. 격자 단위의 지형정보는 USGS(United states geological survey)의 EROS (Earth resources observation and science) 센터에서 생산된 약 1km 해상도의 전 지구 표고자료 (Global 30-arc second elevation data set; GTOPO30)에서 얻어진 DEM (Degital elevation Model)으로부터 구하였다 (Figure 2.1). 한반도의 지형은 삼면이 바다로 둘러싸여 있고 대체로 동쪽이 높고 서쪽이 낮은 동소서저의 특징을 보인다.
격자 단위 기후정보의 검증 기간은 10년으로 설정하여 통계적 모형의 예측성능을 평가하였다(Im과 Ahn, 2011). 모형 평가를 위해 60개의 ASOS를 모형 적합자료로 이용하고, 352개의 AWS를 모형 검증자료로 사용하였다 (Ahn 등, 2014).
본 연구에 이용된 일 평균 기온자료는 기상청에서 2003년부터 2012년까지 10년간 관측된 1월 자료를 사용하였다. 기상청에서는 1973년부터 거점지역을 중심으로 한 약 60개소의 ASOS에서 기상 관측을 시작하였고, 1990년 후반부터 352개의 AWS을 추가로 설치하여 한반도 전역의 기상자료를 수집하고 있다.
본 연구에서 고려된 사전분포는 균등분포를 따르는 β, 역감마분포를 따르는 σ2와 τ2 그리고 감마분포를 따르는 φ이다 (Yoon 등, 2015). 모수를 단계적으로 추론하기 위해선 주변사후분포가 필요하다.
통계모형의 독립변수로 이용된 지형 자료는 위도, 경도, 고도이다. 격자 단위의 지형정보는 USGS(United states geological survey)의 EROS (Earth resources observation and science) 센터에서 생산된 약 1km 해상도의 전 지구 표고자료 (Global 30-arc second elevation data set; GTOPO30)에서 얻어진 DEM (Degital elevation Model)으로부터 구하였다 (Figure 2.
데이터처리
기상청에서는 1973년부터 거점지역을 중심으로 한 약 60개소의 ASOS에서 기상 관측을 시작하였고, 1990년 후반부터 352개의 AWS을 추가로 설치하여 한반도 전역의 기상자료를 수집하고 있다. 격자 단위 기후정보의 검증 기간은 10년으로 설정하여 통계적 모형의 예측성능을 평가하였다(Im과 Ahn, 2011). 모형 평가를 위해 60개의 ASOS를 모형 적합자료로 이용하고, 352개의 AWS를 모형 검증자료로 사용하였다 (Ahn 등, 2014).
이론/모형
공간선형모형의 모수는 R 프로그램의 “DiceKriging” 패키지의 km 함수를 이용하여 최대우도법으로 추정하였다 (Park과 Baek, 2001; Roustant 등, 2012).
베이지안 공간선형모형 (Bayesian spatial linear regression model; BSM)은 SLM을 베이지안 기법을 통해 계층적으로 접근하였다. θ = (β, σ2, τ 2, φ) T를 공간선형모형을 구성하는 모수의 집합으로 본다면, 사후분포 p(θ|y) ∝ f(y|θ)p(θ)는 사전분포 p(θ)와 우도함수로 얻을 수 있다.
베이지안공간선형모형의 상관함수는 공산선형모형과 달리 기상관측소의 거리 (위도, 경도)로 구성하였다. 베이지안 공간선형모형은 총 3,000번 반복수행하였고 R 프로그램의 “spBayes” 패키지의 spLM 함수를 이용하였다 (Andrew 등, 2015).
모수를 단계적으로 추론하기 위해선 주변사후분포가 필요하다. 사후분포에 대한 모의는 마코프 연쇄 몬테카를로 기법 (Markov chain Monte Carlo)을 통해 기약적(irreducible), 비주기적 (aperiodic) 마코프 연쇄를 구축했다 (Benerjee 등, 2004).
통계모형의 예측성능을 평가하기 위해 3가지 평가척도 (Wilks, 2011)가 고려되었다.
성능/효과
연도별 예측성능의 편차가 존재하지만 베이지안 공간선형모형이 다른 통계모형들에 비해 상대적으로 예측력이 우수하였다. 10년간 일별 평가결과이므로 총 310일 (31일 × 10년) 중 RMSE 기준으로 우수한 통계모형의 빈도는 베이지안 공간선형모형 227일 (약 73.2%), 일반화 가법모형 50일(약 16.1%), 공간선형모형 33일 (약 10.6%)이다.
본 연구에서는 선형모형을 기반으로 한 통계모형을 이용하여 고해상도 격자 단위 기후자료를 생성하였다. ASOS에서 관측된 평균기온 자료로 AWS에서 관측된 평균기온 자료를 예측하여 관측된 평균기온값과 비교한 결과 다른 통계모형에 비해 BSM의 RMSE가 낮고 상관계수가 높았다. 하지만 BSM은 계산시간이 비싼 단점을 지니고 있어 100년 이상의 장기간 고해상도 기후자료 생성을 단시간에 얻고자 한다면 GAM 또는 SLM이 대안이 될 수 있다.
641)보다 상대적으로 낮았다. 상관계수도 BSM가 0.921로 다른 통계모형에 비해 상대적으로 높았다. 연도별 예측성능의 편차가 존재하지만 베이지안 공간선형모형이 다른 통계모형들에 비해 상대적으로 예측력이 우수하였다.
921로 다른 통계모형에 비해 상대적으로 높았다. 연도별 예측성능의 편차가 존재하지만 베이지안 공간선형모형이 다른 통계모형들에 비해 상대적으로 예측력이 우수하였다. 10년간 일별 평가결과이므로 총 310일 (31일 × 10년) 중 RMSE 기준으로 우수한 통계모형의 빈도는 베이지안 공간선형모형 227일 (약 73.
분석 결과는 일별 평가척도의 평균이다. 평균적으로 BSM의 RMSE가 1.224로 GAM (1.313), SLM (1.325) 그리고 GLM (1.641)보다 상대적으로 낮았다. 상관계수도 BSM가 0.
후속연구
하지만 BSM은 계산시간이 비싼 단점을 지니고 있어 100년 이상의 장기간 고해상도 기후자료 생성을 단시간에 얻고자 한다면 GAM 또는 SLM이 대안이 될 수 있다. 통계적 모형을 통한 상세화는 기온 뿐만 아니라 상대습도, 강수량, 바람세기 등 다양한 기후자료를 생산할 수 있어 대기중 망간 농도 (Kwon과 Kim, 2016) 또는 이산화질소 농도 (Yoon과 Kim, 2016) 예측에 활용될 수 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
고해상도 격자 단위 기후정보는 어떤 현상을 설명하는 중요 요인 인가?
고해상도 격자 단위 기후정보는 농업, 관광학, 생태학, 질병학 등 다양한 분야의 현상을 설명하는 중요 요인이다. 고해상도 기후정보는 동적 모형과 통계적 모형을 통해 얻을 수 있다.
일반화가법모형에서의 변환함수는 어떤 알고리즘을 통해 추정 가능한가?
GAM에서의 변환함수는 regression spline 알고리즘, backfitting 알고리즘, local scoring 알고리즘 등을 통해 추정할 수 있다 (Hur, 2014). 본 연구의 변환함수는 R 프로그램의 “mgcv” 팩키지의 gam 함수와 regression spline 알고리즘을 통해 추정되었다 (Wood, 2011).
통계모형의 독립변수로 이용된 지형 자료는?
통계모형의 독립변수로 이용된 지형 자료는 위도, 경도, 고도이다. 격자 단위의 지형정보는 USGS(United states geological survey)의 EROS (Earth resources observation and science) 센터에서 생산된 약 1km 해상도의 전 지구 표고자료 (Global 30-arc second elevation data set; GTOPO30)에서 얻어진 DEM (Degital elevation Model)으로부터 구하였다 (Figure 2.
참고문헌 (27)
Ahn, J. B., Lee, J. and Im, E. S. (2012). he reproducibility of surface air temperature over south Korea using dynamical downscaling and statistical correction. Journal of Meteorological Society Japan, 90, 493-507.
Ahres, C. D. (2012). Meteorology today: An introduction to weather, climate, and the environment, Cengage Learning, California.
Andrew, O.F., Banerjee, S. and Gelfand, A.E. (2015). spBayes for large univariate and multivariate point-referenced spatio-temporal data models. Journal of Statistical Software, 63, 1-28.
Benerjee, S., Gelfand, A.E. and Carlin, B.P. (2004). Hierarchical modeling and analysis for spatial data, CRC Press, Boca Raton.
Brunetti, M., Maugeri, M., Nanni, T., Simolo, C. and Spinoni, J. (2014). High?resolution temperature climatology for Italy: Interpolation method intercomparison. International Journal of Climatology, 34, 1278-1296.
Chatterjee, S. and Price, B. (1997). Regression analysis by example, Wiley, New York.
Daly, C., Gibson, W. P., Taylor, G. H., Johnson, G. L. and Pasteris, P. (2002). A knowledge-based approach to the statistical mapping of climate. Climate research, 22, 99-113.
Daly, C., Helmer, E. H. and Quinones, M. (2003). Mapping the climate of Puerto Rico, Vieque and Culebra. International Journal of Climatology, 23, 1359-1138.
Daly, C., Neilson, R. P. and Phillips, D. L. (1994). A statistical-topographic model for mapping climatological precipitation over mountainous terrain. Journal of applied meteorology, 33, 140-158.
Heo, M. H. (2014). Applied data analysis using R, Free Academy, Paju.
Jeong, D. I., St-Hilaire, A., Ouarda, T. B. M. J. and Gachon, P. (2012). Comparison of transfer functions in statistical downscaling models for daily temperature and precipitation over Canada. Stochastic environmental research and risk assessment, 26, 633-653.
Jung, J. Y., Jin, S. H. and Park, M. S. (2008). Precipitation analysis based on spatial linear regression model. Korean Journal of Applied Statistics, 21, 1093-1107.
Kim, M. K., Han, M. S., Jang, D. H., Baek, S. G., Lee, W. S., Kim, Y. H. and Kim, S. (2012). Production technique of observation grid data of 1 km resolution. Journal of climate research, 7, 55-68.
Kwon, H. J. and Kim, Y. (2016). A statistical prediction for concentrations of Manganese in the ambient air. Journal of the Korean Data & Information Science Society, 27, 577-586.
Lee, H. J. (2014).Analysis of statistical models on temperature at the Seosan city in Korea. Journal of the Korean Data & Information Science Society, 25, 1293-1300.
Lee, H. J. (2015). Analysis of statistical models on temperature at the Suwon city in Korea. Journal of the Korean Data & Information Science Society, 26, 1409-1416.
Moon, H. W., Baek, J. J., Hwang, S. W. and Choi, M. H. (2014). Spatial downscaling of grid precipitation using support vector machine regression. Journal of the Korean Water Resources Association, 47, 1095-1105.
Park, C. K., Lee, W. S. and Yun, W. T. (2008). Statistical downscaling for multi-model ensemble prediction of summer monsoon rainfall in the Asia-Pacific region using geopotential height field. Advances in Atmospheric Sciences, 25, 867-884.
Park, J. S. and Baek, J. (2001). Efficient computation of maximum likelihood estimators in a spatial linear model with power exponential covariogram. Computers & Geosciences, 27, 1-7.
Roustant, O., Ginsbourger, D. and Deville, Y. (2012). DiceKriging, DiceOptim: Two R packages for the analysis of computer experiments by kriging-based metamodeling and optimization. Journal of Statistical Software, 51, 1-55.
Skourkeas, A., Kolyva-Machera, F. and Maheras, P. (2010). Estimation of mean maximum summer and mean minimum winter temperatures over Greece in 2070?2100 using statistical downscaling methods. Euro Asian J Sustain Energy Dev Policy, 2, 33-44.
Tolika, K., Maheras, P., Vafiadis, M., Flocas, H. A. and Arseni?Papadimitriou, A. (2007). Simulation of seasonal precipitation and raindays over Greece: A statistical downscaling technique based on artificial neural networks (ANNs). International Journal of Climatology, 27, 861-881.
Wilks, D. S. (2011). Statistical methods in the atmospheric sciences, Academic Press, New York.
Wood, S. N. (2011) Fast stable restricted maximum likelihood and marginal likelihood estimation of semiparametric generalized linear models. Journal of the Royal Statistical Society B, 73, 3-36.
Yoon, S., Kim, M. K. and Park, J. S. (2015). Comparison of statistical linear interpolation models for monthly precipitation in South Korea. Stochastic Environmental Research and Risk Assessment, 29, 1371-1382.
Yoon, S. and Kim, M. G.(2016). Spatio-temporal models for generating a map of high resolution NO2 level. Journal of the Korean Data & Information Science Society, 27, 803-814.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.