[국내논문]위성영상과 머신러닝 모델을 이용한 폭염기간 고해상도 기온 추정 연구 A Study for Estimation of High Resolution Temperature Using Satellite Imagery and Machine Learning Models during Heat Waves원문보기
본 연구에서는 지상기상센서가 설치되지 않은 미 관측지점의 기온정보를 추정하기 위하여 K-최근접 이웃, 랜덤 포레스트, 신경망알고리즘을 대상으로 위성영상을 이용하여 기온자료를 산출하고 그 정확성을 평가·분석하고자 하였다. 위성영상자료는 2019년에 취득된 Landsat-8과 MODIS Aqua/Terra을 이용하였으며, 기상자료는 기상청과 산림청의 AWS/ASOS 자료를 이용하였다. 또한 추정 정확도를 향상시키기 위하여 수치표면 모델, 일사량, 경사방향, 경사도를 생성하여 이용하였다. 머신러닝 알고리즘 정확도 비교는 10-fold 교차검증을 통하여 R2(결정계수) 및 RMSE(평균제곱근오차)의 통계량을 계산하여 대상지역별 추정결과를 비교하였다. 그 결과 신경망 알고리즘이 R2=0.805, RMSE=0.508로 세 알고리즘 중 가장 안정적인 결과를 나타내었다. 신경망 알고리즘을 구축된 위성영상 데이터셋에 적용하여 2019년 6월부터 9월까지의 평균기온 지도를 생성할 수 있었으며 세밀한 기온 정보를 관측할 수 있음을 확인하였다. 연구 성과는 폭염 대응 정책, 열섬완화 연구 등 국가재난안전 관리에 활용 될 수 있을 것으로 기대된다.
본 연구에서는 지상기상센서가 설치되지 않은 미 관측지점의 기온정보를 추정하기 위하여 K-최근접 이웃, 랜덤 포레스트, 신경망 알고리즘을 대상으로 위성영상을 이용하여 기온자료를 산출하고 그 정확성을 평가·분석하고자 하였다. 위성영상자료는 2019년에 취득된 Landsat-8과 MODIS Aqua/Terra을 이용하였으며, 기상자료는 기상청과 산림청의 AWS/ASOS 자료를 이용하였다. 또한 추정 정확도를 향상시키기 위하여 수치표면 모델, 일사량, 경사방향, 경사도를 생성하여 이용하였다. 머신러닝 알고리즘 정확도 비교는 10-fold 교차검증을 통하여 R2(결정계수) 및 RMSE(평균제곱근오차)의 통계량을 계산하여 대상지역별 추정결과를 비교하였다. 그 결과 신경망 알고리즘이 R2=0.805, RMSE=0.508로 세 알고리즘 중 가장 안정적인 결과를 나타내었다. 신경망 알고리즘을 구축된 위성영상 데이터셋에 적용하여 2019년 6월부터 9월까지의 평균기온 지도를 생성할 수 있었으며 세밀한 기온 정보를 관측할 수 있음을 확인하였다. 연구 성과는 폭염 대응 정책, 열섬완화 연구 등 국가재난안전 관리에 활용 될 수 있을 것으로 기대된다.
This study investigates the feasibility of three algorithms, K-Nearest Neighbors (K-NN), Random Forest (RF) and Neural Network (NN), for estimating the air temperature of an unobserved area where the weather station is not installed. The satellite image were obtained from Landsat-8 and MODIS Aqua/Te...
This study investigates the feasibility of three algorithms, K-Nearest Neighbors (K-NN), Random Forest (RF) and Neural Network (NN), for estimating the air temperature of an unobserved area where the weather station is not installed. The satellite image were obtained from Landsat-8 and MODIS Aqua/Terra acquired in 2019, and the meteorological ground weather data were from AWS/ASOS data of Korea Meteorological Administration and Korea Forest Service. In addition, in order to improve the estimation accuracy, a digital surface model, solar radiation, aspect and slope were used. The accuracy assessment of machine learning methods was performed by calculating the statistics of R2 (determination coefficient) and Root Mean Square Error (RMSE) through 10-fold cross-validation and the estimated values were compared for each target area. As a result, the neural network algorithm showed the most stable result among the three algorithms with R2 = 0.805 and RMSE = 0.508. The neural network algorithm was applied to each data set on Landsat imagery scene. It was possible to generate an mean air temperature map from June to September 2019 and confirmed that detailed air temperature information could be estimated. The result is expected to be utilized for national disaster safety management such as heat wave response policies and heat island mitigation research.
This study investigates the feasibility of three algorithms, K-Nearest Neighbors (K-NN), Random Forest (RF) and Neural Network (NN), for estimating the air temperature of an unobserved area where the weather station is not installed. The satellite image were obtained from Landsat-8 and MODIS Aqua/Terra acquired in 2019, and the meteorological ground weather data were from AWS/ASOS data of Korea Meteorological Administration and Korea Forest Service. In addition, in order to improve the estimation accuracy, a digital surface model, solar radiation, aspect and slope were used. The accuracy assessment of machine learning methods was performed by calculating the statistics of R2 (determination coefficient) and Root Mean Square Error (RMSE) through 10-fold cross-validation and the estimated values were compared for each target area. As a result, the neural network algorithm showed the most stable result among the three algorithms with R2 = 0.805 and RMSE = 0.508. The neural network algorithm was applied to each data set on Landsat imagery scene. It was possible to generate an mean air temperature map from June to September 2019 and confirmed that detailed air temperature information could be estimated. The result is expected to be utilized for national disaster safety management such as heat wave response policies and heat island mitigation research.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구는 위성영상별 머신러닝기반 평균 기온 추정 모델은 기온 관측이 이루어지고 있지 않은 영역을 위성 영상과 기상자료를 이용하여 평균기온을 추정하는 것이다. 따라서 평균기온과 위성영상 변수들과의 상관관계를 분석하고 연구모델이 기상 관측소가 없는 지점의 평균기온을 추정할 수 있는 머신러닝 모델을 구축하고 정확도를 평가하기 위하여 검증을 수행하였다. Table 2 에 나타난 위성영상별 자료를 기반으로 머신러닝 모델을 구축하였으며, 학습자료를 10개의 그룹으로 나누어 학습 및 검증데이터의 일정비율(90:10)로 10번 반복하여 오류를 평가하는 교차검증을 수행하였다.
본 연구는 위성에서 산출할 수 있는 다양한 변수들과 머신러닝 기법을 이용하여 여름철인 6월부터 9월까지의 평균기온을 추정하는 모델을 구축하고자 한다. 연구 방법은 Fig.
본 연구는 위성영상별 머신러닝기반 평균 기온 추정 모델은 기온 관측이 이루어지고 있지 않은 영역을 위성 영상과 기상자료를 이용하여 평균기온을 추정하는 것이다. 따라서 평균기온과 위성영상 변수들과의 상관관계를 분석하고 연구모델이 기상 관측소가 없는 지점의 평균기온을 추정할 수 있는 머신러닝 모델을 구축하고 정확도를 평가하기 위하여 검증을 수행하였다.
본 연구에서는 기존 연구에서 MODIS Terra/Aqua 위성만을 사용하였을 경우 1 km의 낮은 해상도를 갖는 제약사항을 30 m 해상도를 갖는 Landsat 위성영상을 적용하여 해상도를 향상시켰으며, 기존 도시 지역의 연구에 국한되어 국가 단위의 데이터 산출에 갖는 한계성을 전국 대상으로 관측된 위성영상과 다양한 머신러닝 기법을 이용하여 전국규모 데이터 생산 기법을 제안하였습니다. 폭염기간인 6월부터 9월까지의 전국단위의 30 m 고해상도의 일정한 분포를 갖는 평균기온 정보를 산출하기 위하여 위성영상과 머신러닝 기법을 이용하여 적합한 평균기온 추정 모델을 개발하고자 하였다.
본 연구에서는 폭염기간인 6월부터 9월까지의 전국 단위의 상세한 평균기온을 산출하기 위하여 위성영상과 머신러닝 기법을 이용하여 적합한 평균기온 추정 모델을 개발하고자 하였다. 이를 위해 Landsat 위성과 MODIS AQUA/TERRA 위성에서 관측된 지표온도를 사용하였다.
본 연구에서는 기존 연구에서 MODIS Terra/Aqua 위성만을 사용하였을 경우 1 km의 낮은 해상도를 갖는 제약사항을 30 m 해상도를 갖는 Landsat 위성영상을 적용하여 해상도를 향상시켰으며, 기존 도시 지역의 연구에 국한되어 국가 단위의 데이터 산출에 갖는 한계성을 전국 대상으로 관측된 위성영상과 다양한 머신러닝 기법을 이용하여 전국규모 데이터 생산 기법을 제안하였습니다. 폭염기간인 6월부터 9월까지의 전국단위의 30 m 고해상도의 일정한 분포를 갖는 평균기온 정보를 산출하기 위하여 위성영상과 머신러닝 기법을 이용하여 적합한 평균기온 추정 모델을 개발하고자 하였다. 이를 위해 MODIS AQUA/TERRA 위성에 Landsat 위성영상에서 관측된 지표온도를 함께 사용하여 해상도를 향상시켰으며, 기상자료로는 기상청과 산림청에서 관측된 AWS와 ASOS의 기상자료를 이용하였다.
제안 방법
이를 위해 MODIS AQUA/TERRA 위성에 Landsat 위성영상에서 관측된 지표온도를 함께 사용하여 해상도를 향상시켰으며, 기상자료로는 기상청과 산림청에서 관측된 AWS와 ASOS의 기상자료를 이용하였다. K-최근접 이웃, 랜덤 포레스트, 신경망의 3가지 기법을 이용하여 평균기온을 추정한 이후 정확도 검증을 통하여 최적의 알고리즘을 선정하고 공간적으로 분석 할 수 있도록 평균기온 지도를 생성하였다.
본 연구에 사용된 Landsat-8 자료는 Table 1과 같다. Landsat-8 위성영상은 광학 위성영상 특성상 구름 등 대기의 영향을 많이 받기 때문에 구름 아래의 지표정보가 차단되기 때문에 영상에서 구름의 영향이 있을 경우, Landsat-8 QA밴드를 이용하여 구름 및 구름그림자 영역을 제거하고 제거된 영역에 대해 변형된 Spectral Similarity Group(SSG) 알고리즘을 통해 영상복원을 수행하였다. 변형된 SSG 알고리즘은 Jin et al.
MOD11A1, MYD 11A1 자료는 하루에 2번씩(주간, 야간)으로 1 km 공간 해상도로 지표온도를 산출한 자료이다(Wan, 2006). MODIS 자료는 1 km 해상도의 영상으로서 학습시 30 m 해상도를 갖는 Landsat 위성영상과 동일한 해상도의 자료를 사용하기 위하여 30 m 해상도로 리샘플링 처리를 수행하였다. 1일 주기로 제공되는 지표온도 자료는 2019년 6월부터 9월까지의 평균을 산출하여 대표 평균 기온자료로 사용하였다.
따라서 평균기온과 위성영상 변수들과의 상관관계를 분석하고 연구모델이 기상 관측소가 없는 지점의 평균기온을 추정할 수 있는 머신러닝 모델을 구축하고 정확도를 평가하기 위하여 검증을 수행하였다. Table 2 에 나타난 위성영상별 자료를 기반으로 머신러닝 모델을 구축하였으며, 학습자료를 10개의 그룹으로 나누어 학습 및 검증데이터의 일정비율(90:10)로 10번 반복하여 오류를 평가하는 교차검증을 수행하였다. 검증을 통하여 위성영상별 머신러닝 기법 정확도를 비교·분석하였으며 정확도가 가장 높은 머신러닝 기법을 이용하여 평균기온 지도를 생성하였다.
세 번째는 최적의 모델을 선정하여 평균기온 지도를 생성 하는 것이다. 기상관측지점이 없어 평균기온 측정이 불가능했던 지역을 관측한 위성영상기반의 데이터세트에 머신러닝 모델을 적용하여 전 지역의 평균기온을 산출하고 영상 간 모자이크를 통하여 전국단위의 평균기온 지도를 생성하였다.
첫 번째는 연구대상지역의 위성영상 전처리를 포함한 데이터세트 구축이다. 데이터세트별로 모든 픽셀에 대하여 동일한 조건으로 구성이 되어야하기 때문에 데이터세트는 입력자료 중 가장 국소적인 관측영역을 가지고 있는 Landsat 위성의 영상 크기를 기준으로 하였다. 두 번째는 K-최근접 이웃, 랜덤 포레스트, 신경망 기법을 이용하여 평균기온 추정 모델을 구축하는 것이다.
데이터세트별로 모든 픽셀에 대하여 동일한 조건으로 구성이 되어야하기 때문에 데이터세트는 입력자료 중 가장 국소적인 관측영역을 가지고 있는 Landsat 위성의 영상 크기를 기준으로 하였다. 두 번째는 K-최근접 이웃, 랜덤 포레스트, 신경망 기법을 이용하여 평균기온 추정 모델을 구축하는 것이다. 파이썬의 싸이킷런(Scikit-learn) 라이브러리를 이용하여 머신러닝 모델을 구축하고 결정계수(R2)와 평균제곱근오차(RMSE)를 이용하여 모델별 정확성을 분석하였다.
또한, 뉴런 개수가 지나치게 증가하면 계산량을 증가시키고 추정 값의 정확성 향상에 큰 영향을 미치지 않는 단점을 나타내기 때문에 최종적으로 뉴런 개수를 30개로 선택하였다. 또한, 최종 값은 활성함수에 따라 다양한 값으로 추정하게 되는데 입력 값이 증가할수록 출력 값도 증가 하는 ReLU 활성함수를 선택하여 기온 추정 모델을 구축하였다.
본 연구에서 구축된 머신러닝 모델 중 R2, RMSE의 정확도 평가에서 적합성이 가장 높게 나온 신경망 기법을 이용하여 연구대상지역에 적용한 후 영상 간 모자이크를 통하여 평균기온 지도를 생성하였다. 생성된 지도는 가시성을 확보하기 위하여 0 ∼ 29°C 간 색상을 반영 하였다.
본 연구에서는 Landsat-8 Collection 1 Level-2자료에서 대기보정된 표면 반사율(Surface Reflectance)로 변환된 근적외선 파장 밴드와 적색 파장 밴드를 연산하여 NDVI를 산출하였으며, 구름의 영향이 있을 경우 지표 온도자료와 동일하게 변형된 SSG알고리즘을 이용하여 구름 영역을 복원하여 사용하였다.
일반적으로 지정한 k 값이 적으면 민감하지만 에러 발생 확률이 높지만, k 값이 늘어날수록 계산량이 증가되고 추정 값이 특성을 따르지 않고 데이터의 평균에 수렴하게 되는 단점이 있기 때문에 최적의 k 값 선정은 연구대상에 맞게 변동 가능하다. 본 연구에서는 k 값을 추정하기 위하여 1에서 50까지 변화시켜 가며 정확도를 비교하였고, 본 연구에 적합한 최적 K 값을 선정하였다. 최대값을 30까지 제한시킨 것은 영상별로 참조점의 수가 30~233개로 많지 않기 때문이다.
3는 변수와 평균기온과의 상관계수를 바 그래프 형태로 표현한 것이다. 본 연구에서는 다양한 변수의 상관성이 최종 결과 값에 미치는 영향성 분석을 고려하여 선행연구로 선정된 변수를 포함하여 모델을 구축하였습니다.
본 연구에서는 동일 입력 변수를 이용하여 평균기온을 추정할 수 있는 머신러닝 모델을 구축하여 정확도를 비교·분석하였다.
, 2016). 본 연구에서는 머신러닝 기법의 적합성을 판단하기 위해서 다음과 같이 두 변수의 선형상관관계에 대한 척도를 측정하기 위한 R2(결정계수, 식 (8))과 추정오차를 계산하기 위한 RMSE(평균제곱근오차, 식 (9))를 계산하였다(Wu et al., 2016).
신경망은 목적에 따라 다양한 종류로 나눌 수 있으며, 본 논문에서는 다층퍼셉트론으로 훈련하는 기법을 이용하여 1개의 층을 이용하였으며 적합한 뉴런의 개수를 선정하기 위하여 위성영상별로 1에서 100까지 뉴런 개수를 변화시켜 정확도를 조사하였습니다. 위성영상별 뉴런 개수가 30개 이후로는 R2 및 RMSE가 일정수준의 정확성에 수렴하는 경향을 나타내었다.
K-최근접 이웃, 랜덤 포레스트, 신경망 3개의 기법을 이용하여 모델을 개발하고 평가한 결과 신경망 기법이 K-최근접 이웃이나 랜덤 포레스트 기법의 모델보다 모델 정확도(R2)가 높았으며, 오차를 나타내는 RMSE가 낮은 것으로 나타나 모델의 예측력이 우수한 것으로 분석되었다. 이는 10개의 영상에서 1개 지역을 제외한 9개 지역에서 동일하게 나타났으며 신경망을 최적의 모델로 선정하고 대상지역에 해당되는 위성영상에 적용을 통하여 전국단위의 평균기온 지도를 제작하였다. 이러한 연구방법 및 결과를 이용하여 목적에 맞게 입력변수를 조정하여 모델을 구축한다면 폭염의 중요한 요소인 최고기온, 최저기온 등 다양한 시기 및 기온 정보를 산출할 수 있을 것으로 판단된다.
본 연구에서는 폭염기간인 6월부터 9월까지의 전국 단위의 상세한 평균기온을 산출하기 위하여 위성영상과 머신러닝 기법을 이용하여 적합한 평균기온 추정 모델을 개발하고자 하였다. 이를 위해 Landsat 위성과 MODIS AQUA/TERRA 위성에서 관측된 지표온도를 사용하였다. Landsat 영상의 지표온도 자료는 Landsat-8 Collection 1 Level-2 자료 중 열 밴드를 밝기온도(BT, Brightness Temperature)자료로 변환한 자료를 이용하였다.
대상 데이터
MODIS 자료는 1 km 해상도의 영상으로서 학습시 30 m 해상도를 갖는 Landsat 위성영상과 동일한 해상도의 자료를 사용하기 위하여 30 m 해상도로 리샘플링 처리를 수행하였다. 1일 주기로 제공되는 지표온도 자료는 2019년 6월부터 9월까지의 평균을 산출하여 대표 평균 기온자료로 사용하였다.
이를 위해 Landsat 위성과 MODIS AQUA/TERRA 위성에서 관측된 지표온도를 사용하였다. Landsat 영상의 지표온도 자료는 Landsat-8 Collection 1 Level-2 자료 중 열 밴드를 밝기온도(BT, Brightness Temperature)자료로 변환한 자료를 이용하였다. BT자료에 NDVI범위에 따라 계산된 지표면 방출률을 이용하여 식 (1)과 같이 지표온도로 산출하여 사용하였다(Zhang et al.
gov/). Landsat-8자료는 2019년 6월부터 9월동안 취득된 자료 중 구름의 영향을 적게 받은 자료를 각 Path-row당 1장씩 사용하였으며, 6월부터 9월까지 촬영된 영상 중에 구름의 영향이 많은 경우에는 5월 영상을 사용하였다. 본 연구에 사용된 Landsat-8 자료는 Table 1과 같다.
기존 영상복원에 주로 사용하는 방법은 다른 날 취득한 영상 또는 타 위성 영상으로부터 화소값을 참조하는 것이 일반적이었지만 변형된 SSG 알고리즘은 타 영상자료의 화소값을 사용 하는 것이 아닌 참조영상의 화소값 위치만 참조할 뿐 화소값은 복원하고자 하는 영상에서 참조하는 방법이다. MODIS 자료는 지표온도 산출물(Product)인 MOD11A1, MYD11A1(Terra, Aqua)를 사용하였다. MOD11A1, MYD 11A1 자료는 하루에 2번씩(주간, 야간)으로 1 km 공간 해상도로 지표온도를 산출한 자료이다(Wan, 2006).
본 연구에서 위성영상을 이용하여 평균기온을 추정하기 위하여 목표값(참값)으로 지상에서 관측된 기상자료를 사용하였다. 기상자료는 기상청과 산림청에서 운영 중인 종관기상관측장비(ASOS, Automated Synoptic Observing System)와 자동기상관측장비(AWS, Automatic Weather System)의 지점별 자동으로 측정된 기온을 연구대상기간 동안 평균 기온 값을 산출하여 사용하였다. 위성영상에서 관측된 영역 내 위치한 지상기상관측지점을 하나의 데이터셋으로 구성하였다(Table 2).
위성영상별 뉴런 개수가 30개 이후로는 R2 및 RMSE가 일정수준의 정확성에 수렴하는 경향을 나타내었다. 또한, 뉴런 개수가 지나치게 증가하면 계산량을 증가시키고 추정 값의 정확성 향상에 큰 영향을 미치지 않는 단점을 나타내기 때문에 최종적으로 뉴런 개수를 30개로 선택하였다. 또한, 최종 값은 활성함수에 따라 다양한 값으로 추정하게 되는데 입력 값이 증가할수록 출력 값도 증가 하는 ReLU 활성함수를 선택하여 기온 추정 모델을 구축하였다.
본 연구에서 위성영상을 이용하여 평균기온을 추정하기 위하여 목표값(참값)으로 지상에서 관측된 기상자료를 사용하였다. 기상자료는 기상청과 산림청에서 운영 중인 종관기상관측장비(ASOS, Automated Synoptic Observing System)와 자동기상관측장비(AWS, Automatic Weather System)의 지점별 자동으로 측정된 기온을 연구대상기간 동안 평균 기온 값을 산출하여 사용하였다.
Path는 Landsat 위성이 지나 가는 방향에서 행(동쪽에서 서쪽)을 나타내며 Row는 열(북쪽에서 남쪽)을 의미한다. 본 연구지역은 제주도를 포함한 남한 전체이며, 연구지역을 포함하는 Landsat 8호 영상은 총 10장이며, Path/Row는 Fig. 2와 같다.
대상지역에 대한 총일사량(Solar Area Radiacne), 경사방향(Aspect), 기울기(Slope)를 추출하기 위해 수치표고모델을 사용하였다. 수치표고모델은 Shuttle Radar Topography Mission(SRTM) DEM 자료를 사용하였다. STRM은 미국 국립지리정보국(NGA, National Geospatial)과 미국 항공우주국(NASA, National Aeronautics and Space Administraion)의 협력으로 추진된 전 세계의 수치표고 모델을 제작하는 프로젝트로, 2000년 2월 11일부터 22일까지 11일동안 취득한 자료를 통해 DEM을 제작하여 1 acr(약 30 m)로 제공되고 있다.
수치표면모델은 인공지물 및 식생 등을 포함한 지구 표면에서부터의 고도를 나타낸 자료이다(Lee and Son, 2016). 수치표면모델은 일본 Japan Aerospace Exploration Agency(JAXA)에서 제공하는 ALOS World 3D(AW3D30)를 이용하였다. AW3D30은 2006년부터 2011년까지 일본 Advanced Land Observing Satellite(ALOS) 위성으로부터 관측된 자료를 통해 제작된 고도 자료이며 해상도는 1 arc(약 30 m)로 무상으로 제공되고 있다(JAXA EORC, 2020).
폭염기간인 6월부터 9월까지의 전국단위의 30 m 고해상도의 일정한 분포를 갖는 평균기온 정보를 산출하기 위하여 위성영상과 머신러닝 기법을 이용하여 적합한 평균기온 추정 모델을 개발하고자 하였다. 이를 위해 MODIS AQUA/TERRA 위성에 Landsat 위성영상에서 관측된 지표온도를 함께 사용하여 해상도를 향상시켰으며, 기상자료로는 기상청과 산림청에서 관측된 AWS와 ASOS의 기상자료를 이용하였다. K-최근접 이웃, 랜덤 포레스트, 신경망의 3가지 기법을 이용하여 평균기온을 추정한 이후 정확도 검증을 통하여 최적의 알고리즘을 선정하고 공간적으로 분석 할 수 있도록 평균기온 지도를 생성하였다.
지표면에 도달하는 태양복사에너지인 직사광(Direct Radiation), 반사광(Reflected Radiation), 산란광(Diffuse Radiation) 중 직사광과 산란광을 이용하여 일사량을 산출하며 단위를 가진다(Fu and Rich, 2000; Fu and Rich, 2002). 총 일사량 자료는 DEM자료를 입력자료로, ArcGIS의 Solar Radiance Tool을 이용하여 2019년 폭염대책기간(6월~9월) 동안의 태양고도각에서 받는 일사량을 산출하였다. 태양복사량 자료는 작물 재배, 자원관리, 토목공학 등 다양한 분야에서 최적의 부지를 결정하는데 사용되는 중요한 입력변수가 된다.
본 연구에서는 평균기온에 영향을 미치는 입력변수와의 상관관계를 분석하기 위하여 피어슨 상관관계 분석법을 사용하였다. 평균기온은 기상청의 AWS/ASOS와 산림청의 AWS에서 관측된 자료를 이용하였으며, 위성영상자료는 위성영상별 지표온도, 식생지수, 수치표면모델, 총 일사량, 경사방향, 경사도를 사용하였다. 피어슨 상관계수는 다음 방정식으로 계산 할 수 있으며, 상관계수의 값이 -1과 +1 사이의 값을 가지는데 +1에 가까울수록 양의 선형 상관관계를 나타내고, -1에 가까울수록 음의 선형 상관관계를 나타낸다(Choi et al.
데이터처리
검증을 통하여 위성영상별 머신러닝 기법 정확도를 비교·분석하였으며 정확도가 가장 높은 머신러닝 기법을 이용하여 평균기온 지도를 생성하였다.
두 번째는 K-최근접 이웃, 랜덤 포레스트, 신경망 기법을 이용하여 평균기온 추정 모델을 구축하는 것이다. 파이썬의 싸이킷런(Scikit-learn) 라이브러리를 이용하여 머신러닝 모델을 구축하고 결정계수(R2)와 평균제곱근오차(RMSE)를 이용하여 모델별 정확성을 분석하였다. 세 번째는 최적의 모델을 선정하여 평균기온 지도를 생성 하는 것이다.
2) 머신러닝 정확도 평가
평균기온 추정 모델의 성능을 분석하기 위해서 본 연구에서는 10-fold 교차 검증을 수행하였다(Table 4, Fig. 4). 10-fold 교차검증은 평가하고자 하는 모델의 성능 측정을 위하여 전체 샘플을 10등분하여 9개의 부분 샘플이 학습 자료인 모델을 구축하고, 나머지 1개의 부분 샘플을 검증 자료로 이용하는 방법이다(Han et al.
이론/모형
, 2015). 경사도는 ArcGIS의 Slope Tool을 이용하여 산출하였다.
경사면이 향하고 있는 방향이 북쪽이면 0°이며 북쪽을 기준으로 시계방향으로 동쪽은 90°, 남쪽은 180°, 서쪽은 270°로 0°에서 360°로 표현되며 경사면의 방향이 없는 평평한 지역에서는 -1값을 나타낸다. 경사방향은 ArcGIS Aspect Tool을 이용 하여 산출하였으며, 산출한 Aspect 자료는 분석에 용이 하게 사용하기 위해 Beers et al. (1966)에 의해 제안된 Transformed Aspect로 재산출하여 사용하였다(Yoo et al., 2018). Transformed Aspect는 식 (3)과 같다.
대상지역에 대한 총일사량(Solar Area Radiacne), 경사방향(Aspect), 기울기(Slope)를 추출하기 위해 수치표고모델을 사용하였다. 수치표고모델은 Shuttle Radar Topography Mission(SRTM) DEM 자료를 사용하였다.
본 연구에서는 평균기온에 영향을 미치는 입력변수와의 상관관계를 분석하기 위하여 피어슨 상관관계 분석법을 사용하였다. 평균기온은 기상청의 AWS/ASOS와 산림청의 AWS에서 관측된 자료를 이용하였으며, 위성영상자료는 위성영상별 지표온도, 식생지수, 수치표면모델, 총 일사량, 경사방향, 경사도를 사용하였다.
성능/효과
본 연구에서는 동일 입력 변수를 이용하여 평균기온을 추정할 수 있는 머신러닝 모델을 구축하여 정확도를 비교·분석하였다. K-최근접 이웃, 랜덤 포레스트, 신경망 3개의 기법을 이용하여 모델을 개발하고 평가한 결과 신경망 기법이 K-최근접 이웃이나 랜덤 포레스트 기법의 모델보다 모델 정확도(R2)가 높았으며, 오차를 나타내는 RMSE가 낮은 것으로 나타나 모델의 예측력이 우수한 것으로 분석되었다. 이는 10개의 영상에서 1개 지역을 제외한 9개 지역에서 동일하게 나타났으며 신경망을 최적의 모델로 선정하고 대상지역에 해당되는 위성영상에 적용을 통하여 전국단위의 평균기온 지도를 제작하였다.
630) 기법 순으로 나타났다. R2과 RMSE를 확인해보면 모두 신경망이 높은 정확도를 보이는 것을 확인할 수 있다.
Table 3은 총 10개의 위성영상별 10개의 변수와 평균 기온 값의 상관계수(r)을 나타낸 표이다. Table 3에서 LSTA-D가 10개 영상 중 5개에서 가장 강한 양의 상관계수 0.67~0.85를 나타내었으며, DSM은 모든 7개 영상에서 가장 강한 음의 상관계수 -0.73~-0.96을 나타내었다. 또한, 각 위성영상별 변수와 평균기온의 상관관계가 다르게 나타난다.
평균기온 추정 값과 관측 값이 모두 선형적인 특징을 나타내는 것을 확인 할 수 있다. 그러나 10개의 영상 중 9개 영상에서 모든 알고리즘에서 R2이 0.7 이상을 나타나지만 1개(116-036)의 영상에서 0.3~0.5 정도의 값을 나타내어 현저히 떨어진 성능을 확인할 수 있었다. 이는 해당 영상 내의 기상자료 관측점의 위치, 입력변수에서 나타내는 이상 특징 등을 면밀히 파악하여 원인을 분석할 필요가 있다고 판단된다.
그리고 머신러닝 기법별 평균을 보면 오차가 신경망(RMSE=0.508) < 랜덤 포레스트(RMSE=0.551) < K-최근접 이웃(RMSE=0.630) 기법 순으로 나타났다.
또한 각 기법의 평균을 기준으로는 정확도가 신경망(R2mean=0.805) > 랜덤 포레스트(R2mean=0.789) > K-최근접 이웃(R2mean=0.745) 기법 순으로 나타났다.
생성된 지도는 가시성을 확보하기 위하여 0 ∼ 29°C 간 색상을 반영 하였다. 연구대상지역 토지피복도(Fig. 2)와 평균기온 지도(Fig. 5)를 비교하면 도시지역, 농림지역에서 주로 상위 온도 분포를 가지고 있는 것으로 보이며, 산림지역에서 하위의 온도 분포가 나타나는 것을 확인할 수 있다. 이는 토지피복이나 고도가 평균기온 값을 결정하는데 중요한 변수라고 보여 질 수 있지만 보다 정확한 정량적인 분석을 위해서는 머신러닝 모델에 입력되는 변수와 결과의 상관성 분석 등을 통한 추가적인 연구가 필요하다고 판단된다.
최대값을 30까지 제한시킨 것은 영상별로 참조점의 수가 30~233개로 많지 않기 때문이다. 영상별로 비교해본 결과, k 값이 증가 할수록 R2 및 RMSE가 정확성이 증가하다가 k=5 이후에는 결과값이 전체 평균값으로 수렴하며 정확성이 감소하는 변화를 보였다. k 값이 증가되면 계산량이 증가되고 결과값이 평균으로 수렴하는 단점이 있으므로 최종적으로 k=5로 선정하여 모델을 구축하였다(Yim et al.
4는 위성영상 별 머신러닝 기법을 적용하여 산출 된 결과물의 산포도로서 파란점은 평균기온 값, 회색선은 기준선, 빨간선은 회귀선을 나타낸 그림이다. 평균기온 추정 값과 관측 값이 모두 선형적인 특징을 나타내는 것을 확인 할 수 있다. 그러나 10개의 영상 중 9개 영상에서 모든 알고리즘에서 R2이 0.
745) 기법 순으로 나타났다. 평균제곱근오차RMSE는 신경망기법이 10개 지역 중 8개 지역에서 RMSE(0.444~0.586)가 가장 낮게 나타났으며, K-최근접 이웃은 1개 지역 RMSE(0.472)로 가장 낮게 나타났다. 그리고 머신러닝 기법별 평균을 보면 오차가 신경망(RMSE=0.
후속연구
하지만 본 연구에서는 훈련 표본 수로 사용된 기상관측자료는 주로 시가지, 초지, 산림 지역에 위치한 자료의 제한된 결과로 보다 다양한 토지피복을 가지고 있는 지표에 적용하기 위한 머신러닝 기법의 효용성을 결정하기에는 다소 무리가 있을 것으로 판단된다. 따라서 향후 연구에서는 다양한 토지피복에서 관측된 기상자료를 대상으로 한 추가 검증이 필요한 것으로 판단된다. 본 연구의 경우 3개의 머신러닝 기법의 정확도 차이를 분석하는데 초점을 두고 진행하였기 때문에 이번 연구 결과물을 기반으로 향후 추정된 평균기온의 분포나 도시지역의 미세한 변화 패턴을 공간적인 관점에서 분석 한다면 국가나 지자체의 폭염 대응 정책을 수립하는데 과학적인 근거로서 활용 할 수 있을 것으로 기대한다.
따라서 향후 연구에서는 다양한 토지피복에서 관측된 기상자료를 대상으로 한 추가 검증이 필요한 것으로 판단된다. 본 연구의 경우 3개의 머신러닝 기법의 정확도 차이를 분석하는데 초점을 두고 진행하였기 때문에 이번 연구 결과물을 기반으로 향후 추정된 평균기온의 분포나 도시지역의 미세한 변화 패턴을 공간적인 관점에서 분석 한다면 국가나 지자체의 폭염 대응 정책을 수립하는데 과학적인 근거로서 활용 할 수 있을 것으로 기대한다.
5)를 비교하면 도시지역, 농림지역에서 주로 상위 온도 분포를 가지고 있는 것으로 보이며, 산림지역에서 하위의 온도 분포가 나타나는 것을 확인할 수 있다. 이는 토지피복이나 고도가 평균기온 값을 결정하는데 중요한 변수라고 보여 질 수 있지만 보다 정확한 정량적인 분석을 위해서는 머신러닝 모델에 입력되는 변수와 결과의 상관성 분석 등을 통한 추가적인 연구가 필요하다고 판단된다.
이는 10개의 영상에서 1개 지역을 제외한 9개 지역에서 동일하게 나타났으며 신경망을 최적의 모델로 선정하고 대상지역에 해당되는 위성영상에 적용을 통하여 전국단위의 평균기온 지도를 제작하였다. 이러한 연구방법 및 결과를 이용하여 목적에 맞게 입력변수를 조정하여 모델을 구축한다면 폭염의 중요한 요소인 최고기온, 최저기온 등 다양한 시기 및 기온 정보를 산출할 수 있을 것으로 판단된다.
하지만 본 연구에서는 훈련 표본 수로 사용된 기상관측자료는 주로 시가지, 초지, 산림 지역에 위치한 자료의 제한된 결과로 보다 다양한 토지피복을 가지고 있는 지표에 적용하기 위한 머신러닝 기법의 효용성을 결정하기에는 다소 무리가 있을 것으로 판단된다. 따라서 향후 연구에서는 다양한 토지피복에서 관측된 기상자료를 대상으로 한 추가 검증이 필요한 것으로 판단된다.
참고문헌 (39)
Beers, T. W., P. E. Dress, and L. C. Wensel, 1966. Notes and observations : aspect transformation in site productivity research, Journal of Forest, 64(10): 691-692.
Bishop, C. M., 1995. Neural Networks for Pattern Recognition, Oxford University Press, New York, p. 482.
Breiman, L., 2001. Random Forests, Machine Learning, 45(1): 5-32.
Burrough, P. A., R. McDonnell, R. A. McDonnell, and L. D. Lloyd, 2015. Principles of Geographical Information Systems, Oxford University Press, NY, USA, p. 190.
Cao, X. H., I. Stojkovic, and Z. Obradovic, 2016. A robust data scaling algorithm to improve classification accuracies in biomedical data, BMC Bioinformatics, 17(1): 359.
Cho, H. M. and Y. H. Lee, 2018. The Improvement plan for Seoul heat response, Policy Report, 257: 4.
Choi, M. H., N. J. Jung, K. C. Lee, J. S. Jeong, and I. Y. Seo, 2019. Development of artificial neural network algorithm for the prediction of power failures by natural disaster, Transactions of the Korean Institute of Electrical Engineers, 68(9): 1085-1093.
Fu, P. and P. M. Rich, 2000. The solar analyst 1.0 user manual, Helios Environmental Modeling Institute (HEMI), USA, p. 1616.
Fu, P. and P. M. Rich, 2002. A geometric solar radiation model with applications in agriculture and forestry, Computers and Electronics in Agriculture, 37(1-3): 25-35.
Gardner, M. W. and S. R. Dorling, 1998. Artificial neural networks (the multilayer perceptron) - A review of applications in the atmospheric sciences, Atmospheric Environments, 32(14-15): 2627-2636.
Gu, H., L. Dai, G. Wu, D. Xu, S. Wang, and H. Wang, 2006. Estimation of forest volumes by integrating Landsat TM imagery and forest inventory data, Science in China Series E: Technological Sciences, 49(1): 54-62.
Han, D., Y. J. Kim, J. Im, S. Lee, Y. Lee, and H. Kim, 2018. The estimation of arctic air temperature in summer based on Machine Learning approaches using IABP Buoy and AMSR2 satellite data, Korean Journal of Remote Sensing, 34(6-2): 1261-1272.
JAXA EORC (Japan Aerospace Exploration Agency Earth Observation Research Center), May 2020. ALOS Global Digital Surface Model (DSM) ALOS World 3D-30 m (AW3D30), Product Description Ver.3.1.
Jedlovec, G., D. Crane, and D. Quattrochi, 2017. Urban heat wave hazard and risk assessment, Results in Physics, 7: 4249-4295
Jin, S., C. Homer, L. Yang, G. Xian, J. Fry, P. Danielson, and P. A. Townsend, 2013. Automated cloud and shadow detection and filling using two-date Landsat imagery in the USA, International Journal of Remote Sensing, 34(5): 1540-1560.
Jung, J. H., J. Heo, S. H. Yoo, K. M. Kim, and J. B. Lee, 2010. Estimation of aboveground biomass carbon stock in Danyang area using kNN algorithm and Landsat TM seasonal satellite images, Journal of Korean Society for Geospatial Information Science, 18(4): 119-129.
Jung, M. H., S. H. Lee, E, M. Chang, S. W. Hong, 2012, Method of monitoring forest vegetation change based on change of MODIS NDVI time series pattern, Journal of Korea Spatial Information Society, 20(4): 47-55.
Katila, M. and E. Tomppo. 2001. Selecting estimation paramters for the finish multisource national forest inventory, Remote Sensing of Environment, 767: 16-32.
Keramitsoglou, I., C. T. Kiranoudis, B. Maiheu, K. Ridder, I. A. Daglis, P. Manunta, and M. Paganimi, 2013. Heat wave hazard classification and risk assessment using artificial intelligence fuzzy logic, Environmental Monitoring and Assessment, 185: 8239-8258.
Kim, B. H., Y. H. Kim, Y. K. Han, W. S. Choi, and Y. I. Kim, 2014. Fully automated generation of cloud-free imagery using Landsat-8, Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, 32(2): 133-142 (in Korean with English abstract).
Kim, M., 2020. The hazard Viz-platform for the establishment of heatwave response strategies, Journal of Korea Multimedia Society, 23(5): 683-699.
KMA (Korea Meteorological Administration), 2020. Korean Climate Change Assessment Report 2020, Korea Meteorological Administration, KR, pp. 307-328.
Koo, Y. H., S. M. Kim, M. Oh, and H. D. Park, 2019. Estimation of solar irradiance at weather stations in Korea using regionally trained artificial neural network models, Journal of the Korean Society of Mineral and Energy Resources Engineers, 56(2): 155-171.
Lee, C. H., 2005. Calculating attribute weights in k-nearest neighbor algorithms using information theory, The Korean Institute of Information Scientists and Engineers, 32(9): 920-926.
Lee, E. J., C. H. Min, and T. S. Kim, 2008. Development of the KOSPI (Korea Composite Stock Price Index) forecast model using neural network and statistical methods, The Institute of Electronics and Information Engineers, 45(5): 95-101.
Lee, G. W. and S. W. Son, 2016. Geo-Spatial Information System, Seoul, Goomibook.
Lee, M., Y. Kim, Y. Jun, and Y. Shin, 2019. Random forest based prediction of road surface condigion using spatio-temporal features, Journal of Korean Society of Transportation, 37(4): 338-349 (in Korean with English abstract). .
NDMI (National Disaster Management Research Institute), 2017. Development of Analysis Technique Using Land Surface Temperature Based on Satellite Data, Research Report, National Disaster Management Research Institute, KR.
Nilson, M., J. Bohlin, H. Olsson, S. A. Svensson, and M. Haapaniemi, 2005. Operational use of remote sensing for regional level assessment of forest estate values, New Strategies for European Remote Sensing, 24: 263-268.
Noi, P. T., J. Degener, and M. Kappas, 2017. Comparison of multiple linear regression, cubist regression, and random forest algorithms to estimate daily air surface temperature from dynamic combinations of MODIS LST data, Remote Sensing, 9(5): 398.
Park, W. S. and M. S. Suh, 2011. Characteristics and trends of tropical night occurrence in South Korea for recent 50 years (1958-2007), Atmosphere, 21(4): 361-371.
Reese, H., M. Nilson, P. Sandstrm, and H. Olsson. 2002. Applications using estimates of forest paramters derived from satellite and forest inventory data, Computers and Electronics in Agriculture, 37(1): 37-55.
Rouse, J. W., R. H. Haas, J. A. Schell and D. W. Deeringm, 1974. Monitoring vegetation systems in the Great Plains with ERTS, Proc. of 1974 3rd Earth Resource Techonology Satellite (ERTS) Symposium, Washington D.C, USA, Dec. 10-14, pp. 309-317.
Teixeira Pinto, C., X. Jing, and L. Leigh, 2020. Evaluation analysis of Landsat level-1 and level-2 data products using In situ measurements, Remote Sensing, 12(16): 2597.
Wan, Z., 2006. MODIS land surface temperature products users' guide, Institute for Computational Earth System Science, University of California: Santa Barbara, CA, USA.
Wu, C., H. Shen, A. Shen, J. Deng, M. Gan, J. Zhu, H. Xu, and K. Wang, 2016. Comparison of machine-learning methods for above-ground biomass estimation based on Landsat imagery, Journal of Applied Remote Sensing, 10(3): 03510.
Yim, J. S., G. S. Kong, S. H. Kim, and M. Y. Shin, 2007. Forest thematic maps and forest statistics using the k-nearest neighbor technique for Pyeongchang-gun, Gangwon-do, Journal of Korean Society of Forest Science, 96(3): 259-268 (in Korean with English abstract).
Yoo, C., J. Im, S. Park, and L. J. Quackenbush, 2018. Estimation of daily maximum and minimum air temperatures in urban landscapes using MODIS time series satellite data, ISPRS Journal of Photogrammetry and Remote Sensing, 137: 149-162.
Zhang, J., Y. Wang, and Y. Li, 2006. A C++ program for retrieving land surface temperature from the data of Landsat TM/ETM+ band6, Computers & Geosciences, 32(10): 1796-1805.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.