가뭄은 산불을 일으킬 수 있는 요소 중 하나로, 산불의 빈도 및 피해 면적과 연관성이 있다. 특히, 우리나라는 가뭄이 주로 발생하는 건조한 봄과 가을에 산불이 많이 발생하고, 그 중 일부는 강풍을 동반하여 대형산불로 번지는 경향을 보인다. 따라서 본 연구에서는 우리나라를 대상으로 산불발생 및 면적과 가뭄 변수의 관련성을 파악하고, 우리나라에 적합한 가뭄 변수를 이용하여 산불발생위험 추정을 위한 위성기반의 가뭄지수를 개발하였다. 사용한 가뭄 변수는 다운스케일링(downscaling)한 고해상도의 토양수분, Normalized Different Water Index(NDWI), Normalized Multi-band Drought Index(NMDI), Normalized Different Drought Index(NDDI), Temperature Condition Index(TCI), Precipitation Condition Index(PCI), Vegetation Condition Index(VCI)이며, 경험적 가중 선형조합(Weighted Linear Combination) 및 One-class SVM을 통해 지수 개발을 하였다. 2013년부터 2017년 기간 동안의 변수를 이용하여 상관성 분석을 통해 대부분의 가뭄 변수가 산불 발생에 유의미한 결과를 보임을 확인했으며, 특히 토양수분과 NDWI, PCI가 우리나라 산불과 상관성을 보였다(88 % 이상 일치함). 개발된 지수를 2018년 산불 발생 건에 대해 적용한 결과, 다섯 가지의 선형조합 중에서 토양수분과 NDWI의 조합이 시 공간적으로 적합한 것으로 나타났으며, One-class SVM은 대형산불에 적합한 것으로 나타났다.
가뭄은 산불을 일으킬 수 있는 요소 중 하나로, 산불의 빈도 및 피해 면적과 연관성이 있다. 특히, 우리나라는 가뭄이 주로 발생하는 건조한 봄과 가을에 산불이 많이 발생하고, 그 중 일부는 강풍을 동반하여 대형산불로 번지는 경향을 보인다. 따라서 본 연구에서는 우리나라를 대상으로 산불발생 및 면적과 가뭄 변수의 관련성을 파악하고, 우리나라에 적합한 가뭄 변수를 이용하여 산불발생위험 추정을 위한 위성기반의 가뭄지수를 개발하였다. 사용한 가뭄 변수는 다운스케일링(downscaling)한 고해상도의 토양수분, Normalized Different Water Index(NDWI), Normalized Multi-band Drought Index(NMDI), Normalized Different Drought Index(NDDI), Temperature Condition Index(TCI), Precipitation Condition Index(PCI), Vegetation Condition Index(VCI)이며, 경험적 가중 선형조합(Weighted Linear Combination) 및 One-class SVM을 통해 지수 개발을 하였다. 2013년부터 2017년 기간 동안의 변수를 이용하여 상관성 분석을 통해 대부분의 가뭄 변수가 산불 발생에 유의미한 결과를 보임을 확인했으며, 특히 토양수분과 NDWI, PCI가 우리나라 산불과 상관성을 보였다(88 % 이상 일치함). 개발된 지수를 2018년 산불 발생 건에 대해 적용한 결과, 다섯 가지의 선형조합 중에서 토양수분과 NDWI의 조합이 시 공간적으로 적합한 것으로 나타났으며, One-class SVM은 대형산불에 적합한 것으로 나타났다.
Drought is one of the factors that can cause wildfires. Drought is related to not only the occurrence of wildfires but also their frequency, extent and severity. In South Korea, most wildfires occur in dry seasons (i.e. spring and autumn), which are highly correlated to drought events. In this study...
Drought is one of the factors that can cause wildfires. Drought is related to not only the occurrence of wildfires but also their frequency, extent and severity. In South Korea, most wildfires occur in dry seasons (i.e. spring and autumn), which are highly correlated to drought events. In this study, we examined the relationship between wildfire occurrence and drought factors, and developed satellite-based new drought indices for assessing wildfire risk over South Korea. Drought factors used in this study were high-resolution downscaled soil moisture, Normalized Different Water Index (NDWI), Normalized Multi-band Drought Index (NMDI), Normalized Different Drought Index (NDDI), Temperature Condition Index (TCI), Precipitation Condition Index (PCI) and Vegetation Condition Index (VCI). Drought indices were then proposed through weighted linear combination and one-class support vector machine (One-class SVM) using the drought factors. We found that most drought factors, in particular, soil moisture, NDWI, and PCI were linked well to wildfire occurrence. The validation results using wildfire cases in 2018 showed that all five linear combinations produced consistently good performance (> 88% in occurrence match). In particular, the combination of soil moisture and NDWI, and the combination of soil moisture, NDWI, and precipitation were found to be appropriate for representing wildfire risk.
Drought is one of the factors that can cause wildfires. Drought is related to not only the occurrence of wildfires but also their frequency, extent and severity. In South Korea, most wildfires occur in dry seasons (i.e. spring and autumn), which are highly correlated to drought events. In this study, we examined the relationship between wildfire occurrence and drought factors, and developed satellite-based new drought indices for assessing wildfire risk over South Korea. Drought factors used in this study were high-resolution downscaled soil moisture, Normalized Different Water Index (NDWI), Normalized Multi-band Drought Index (NMDI), Normalized Different Drought Index (NDDI), Temperature Condition Index (TCI), Precipitation Condition Index (PCI) and Vegetation Condition Index (VCI). Drought indices were then proposed through weighted linear combination and one-class support vector machine (One-class SVM) using the drought factors. We found that most drought factors, in particular, soil moisture, NDWI, and PCI were linked well to wildfire occurrence. The validation results using wildfire cases in 2018 showed that all five linear combinations produced consistently good performance (> 88% in occurrence match). In particular, the combination of soil moisture and NDWI, and the combination of soil moisture, NDWI, and precipitation were found to be appropriate for representing wildfire risk.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
Margin Support vectors를 기준으로 내부 vectors는 class가 할당되고, 외부에 있는 vectors는 이상치로 구분된다. 기존의 이진분류 SVM을 사용하여 기계학습 모델을 개발할 경우 산불 비 발생 샘플 추출에 대한 개발자의 주관적인 견해가 포함되므로 본 연구에서는 기계학습 기법 중 하나인 One-Class SVM을 통한 산불 발생과 관련된 가뭄지수 또한 개발하였다. 앞선 선형 가중치 적용에 사용된 모든 인자를 입력변수로 하여 커널(kernel)함수는 방사기저함수(Radial basis function, RBF)를 이용하였다.
주로 2-5월인 봄철과 11-12월인 가을철에 주로 발생하며,이는 우리나라의 가뭄 발생 기간과 거의 일치한다(Yoon and Won, 2016). 따라서 본 연구에서는 우리나라를 대상으로 위성기반의 다중 가뭄 인자를 활용하여 산불발생위험을 대변할 수 있는 가뭄지수를 개발하였다. Global Land Data Assimilation System(GLDAS)의 토양수분을 1 km로 다운스케일링(downscaling)한 고해상도의 토양수분(soil moisture), MODIS의 지표반사도(surface reflectance), 지표면 온도(land surface temperature, LST),식생지수(normalized difference vegetation index, NDVI),Tropical Rainfall Measuring Mission (TRMM)의 일 누적강수량을 1 ha 이상의 산불 발생 건(2013-2017년)과 비교·분석하였다.
본 연구는 우리나라의 산불발생에 영향을 끼치는 가뭄 인자를 파악했을 뿐만 아니라 앞선 연구에서 사용하지 않았던 고해상도의 토양수분을 고려하여 산불발생위험을 대변하는 새로운 가뭄 지수를 개발하였다. 단순경험적인 방법 외에 기계학습 기법을 사용하여 가뭄으로 인한 산불발생위험 추정에 대해 기계학습의 가능성을 보여주었다.
본 연구에서는 산불발생위험 추정을 위한 가뭄지수개발을 위해, 기계학습 종류 중 하나인 랜덤 포레스트를 기반으로 하여 25 km의 토양수분 자료를 1 km의 토양수분으로 고해상도화 하였으며(Fig. 2(a)), 그 외 가뭄 인자와 함께 산불 발생과의 상관성 파악을 통해 향후 지수개발 모델의 입력변수로써 사용하였다(Fig.
본 연구에서는 위성기반의 가뭄 변수를 이용하여 우리나라에 적합한 산불발생위험을 대변하는 가뭄지수를 개발하였다. 가뭄지수 개발에 앞서 기계학습 기법인랜덤 포레스트 기반의 고해상도 토양수분 자료를 산출하여 가뭄 지수 개발에 이용하였다.
가설 설정
The overall flowchart of developing satellite-based drought indices for assessing wildfire risk. (a) soil moisture downscaling and (b) drought index development linked to wildfire risk.
제안 방법
본 연구에서는 산불발생위험 추정을 위한 가뭄지수개발을 위해, 기계학습 종류 중 하나인 랜덤 포레스트를 기반으로 하여 25 km의 토양수분 자료를 1 km의 토양수분으로 고해상도화 하였으며(Fig. 2(a)), 그 외 가뭄 인자와 함께 산불 발생과의 상관성 파악을 통해 향후 지수개발 모델의 입력변수로써 사용하였다(Fig. 2(b)).
Global Land Data Assimilation System(GLDAS)의 토양수분을 1 km로 다운스케일링(downscaling)한 고해상도의 토양수분(soil moisture), MODIS의 지표반사도(surface reflectance), 지표면 온도(land surface temperature, LST),식생지수(normalized difference vegetation index, NDVI),Tropical Rainfall Measuring Mission (TRMM)의 일 누적강수량을 1 ha 이상의 산불 발생 건(2013-2017년)과 비교·분석하였다.
1 단위로 테스트를 진행한 후 경험적으로 최적화하였다. NDWI는 밴드 7을 이용했을 때 상대적으로 상관성이 떨어지는 경향을 보여(Fig. 5), 밴드 5번과 6번의 평균을이용하였으며, 강수량은 PCI1과 PCI2를 평균하여 사용하였다.
가뭄지수 개발에 기존 연구에서 제안된 가뭄 인자의 적용을 위해 일 강수량(TRMM 3B42), Terra MODIS에서 제공하는 일 지표 반사도(MOD09GA), 일 지표면온도(MOD11A1)를 이용하였다. Integrated Multi-satellitERetrievals for Global Precipitation Mission(GPM IMERG)가 2014년 7월부터 10 km로 제공되고 있으나 본 연구기간(2013-2018)에 적합하지 않아 TRMM 3B42 강수량을 대신 사용하였다.
Integrated Multi-satellitERetrievals for Global Precipitation Mission(GPM IMERG)가 2014년 7월부터 10 km로 제공되고 있으나 본 연구기간(2013-2018)에 적합하지 않아 TRMM 3B42 강수량을 대신 사용하였다. 강수량으로 인한 가뭄발생은 보통 월 단위(e.g. 1-, 3-, 6-개월)로 진행되나 일 기준으로 변화가 미미하여 강수량으로 인한 일별 변화를 확인하기 위해 1주, 2주 누적한 강수량을 각각 사용하였다.
개발된 가뭄지수는 2018년 산불발생 건에 대해 비교·검증하였다.
가뭄지수 개발에 앞서 기계학습 기법인랜덤 포레스트 기반의 고해상도 토양수분 자료를 산출하여 가뭄 지수 개발에 이용하였다. 그 외, 수분을 측정할 수 있는 NDWI, NMDI, NDDI, PCI, TCI, VCI를 이용하여 경험적 가중 선형조합과 One-class SVM을 이용하여 가뭄 지수를 개발하였다. 경험적 가중 선형조합에 있어서는 토양수분, NDWI를 기반으로 조합했을 때 산불 발생과 관련성이 높게 나타났으며, One-class SVM이용에서는 산불 피해면적이 넓은 건에 대해서 적합함을 보였다.
다중 위성자료 및 재분석 자료를 이용하여 토양수분다운스케일링 모델 및 가뭄지수를 개발하였다. 토양수분 다운스케일링 모델 개발에 2013년부터 2015년까지의 동안의 GLDAS 일 평균 토양수분 자료(1-10 cm),Meteorological Operational(Metop) Advanced SCATterometter(ASCAT) 의 일 평균 토양수분 자료, Terra Moderate Resolution Imaging Spectroradiometer(MODIS)의 16일 식생지수(MOD13A2), 8일 평균 지표면 온도(MOD11A2)와 Shuttle Radar Topography Mission(SRTM)의 Digital Elevation Model(DEM), TRMM의 일 강수 자료(3B42)를이용하였다(Table 1).
, 2013). 따라서 본 연구에서는 가뭄지수 개발에 있어 높은 상관성을 보였던 토양수분, NDWI5-7,TCI, NMDI, PCI1-2을 이용하였다.
하지만 PCI를 시공간적으로 분석해본 결과, 강수의 발생 유무에 따라 값의 편차가 크고(0 또는 1에 가까운 값을 가짐) 공간적 편차가 적은 경향을 보였다. 따라서 본 연구에서는 경험적 가중 선형조합에 있어 강수량 다음으로 상관성이 높았던 토양수분 및NDWI를 기준으로(스킴 1(Scheme 1)), 토양과 식생의 수분에 영향을 끼칠 수 있는 온도를 반영한 스킴 2,SWIR 파장 영역의 수분 탐지를 극대화하여 토양 뿐만 아니라 식생의 수분을 탐지할 수 있는 스킴 3, 강수량의 충분 및 부족을 반영한 스킴 4, 온도와 강수를 모두 고려한 스킴 5에 대해 수행하였으며(Table 3), 각각의 가중치는 가중치의 합이 1이 되게 각 인자들의 가중치를 0.1 단위로 테스트를 진행한 후 경험적으로 최적화하였다. NDWI는 밴드 7을 이용했을 때 상대적으로 상관성이 떨어지는 경향을 보여(Fig.
, 2016).모든 자료의 공간 해상도의 통일성을 위하여 모든 입력자료는 GLDAS 토양수분과 같은 격자 크기인 25 km의 공간해상도로 resampling한 후 모델 구축에 적용되었다. 이후 개발된 모델에 1 km 격자 크기로 변환한 6개의 변수 자료를 적용시켜 최종적으로 1 km 격자의 고해상도토양수분 자료를 산출하였다.
, 2013), VCI는 식생의 활력 감소로(Kogan, 2002) 인한 가뭄 발생을 나타내는 변수이다. 변수 값의 통일성을 위해 고해상도 토양수분, NDWI, NMDI, NDDI는 시계열적으로 정규화(normalizing)하여 0-1 사이의 범위로 생산하였다.
이후 개발된 모델에 1 km 격자 크기로 변환한 6개의 변수 자료를 적용시켜 최종적으로 1 km 격자의 고해상도토양수분 자료를 산출하였다. 본 연구에서는 2013-2014년 자료에 대하여 10-fold 교차검증을 수행하여 모델을 구축하였다. 10-fold 교차 검증은 전체 자료를 10등분하여 9개는 훈련자료로 나머지 1개는 검증자료로 이용하는 방법으로, 상호 배타적으로 등분하여 전체 자료에 대해 모델을 평가하여 많은 연구에서 모델의 정확도를 추정하는데 이용했다(Yoo et al.
본 연구에서는 산불 발생 건에 대한 10 가지 가뭄 변수를 경험적 가중 선형조합 방식과 One-class SVM을 적용하여 가뭄지수를 개발하였다. 2013년부터 2017년까지의 1 ha 이상의 산불 발생 건(192 건)에 대해 훈련하고,2018년도 산불 건(49 건)에 대해 검증하였다.
854의 결과를 보였다. 본 연구에서는GLDAS 토양수분 자료의 공간상세화를 위하여 2013-2014년 기간 동안의 ASCAT 토양수분, 8일 합성 지표면 온도, 16일 합성 식생지수, SRTM의 DEM, 5일 누적 강수량과 7일 누적 강수량을 입력변수로 하여 랜덤 포레스트(Random Forest) 기반의 토양수분 다운스케일링 모델을 개발하였다. 사용한 랜덤 포레스트 모델은 훈련 과정에서 독립적인 결정트리(Decision Tree) 그룹을 구성하여 앙상블 기법을 통해 입력변수로부터 종속 변수의 값을 예측하는 기계학습 기법 중 하나이며(Breiman, 2001),기존의 기계학습 기반의 위성 산출물 다운스케일링 연구에서 다른 기계학습 기법 보다 상대적으로 우수한 성능을 보였다(Im et al.
2(b)). 선정된 입력 변수 간의 경험적 가중 선형조합 및 One-class SVM의 두 가지 방식을 통해 산불발생위험을 대변하는 새로운 가뭄 지수를 개발하였다. 자세한 내용은 아래와 같다.
Global Land Data Assimilation System(GLDAS)의 토양수분을 1 km로 다운스케일링(downscaling)한 고해상도의 토양수분(soil moisture), MODIS의 지표반사도(surface reflectance), 지표면 온도(land surface temperature, LST),식생지수(normalized difference vegetation index, NDVI),Tropical Rainfall Measuring Mission (TRMM)의 일 누적강수량을 1 ha 이상의 산불 발생 건(2013-2017년)과 비교·분석하였다. 이를 통해 선정된 가뭄 인자에 대해 경험적 가중 선형조합 및 One-class Support vector machine(One-class SVM) 기법을 적용하여 산불 발생 위험을 대변하는 가뭄지수를 개발하였다. 개발된 가뭄지수는 2018년 산불발생 건에 대해 비교·검증하였다.
모든 자료의 공간 해상도의 통일성을 위하여 모든 입력자료는 GLDAS 토양수분과 같은 격자 크기인 25 km의 공간해상도로 resampling한 후 모델 구축에 적용되었다. 이후 개발된 모델에 1 km 격자 크기로 변환한 6개의 변수 자료를 적용시켜 최종적으로 1 km 격자의 고해상도토양수분 자료를 산출하였다. 본 연구에서는 2013-2014년 자료에 대하여 10-fold 교차검증을 수행하여 모델을 구축하였다.
토양수분 다운스케일링 모델의 결과를 검증하기 위하여 농촌진흥청에서 제공하는 현장관측기반의 토양수분 자료와 각 관측소 별로 시계열 분석을 수행하였다. Fig.
, 2012). 트리 개수를 100개와 200개로 설정하여 동일한 모델을 개발하였을 때, 두 경우 모두교차검증의 성능이 r=0.91 및 RMSE=0.0184 m3/m3였으며 rRMSE는 각 6.7% 및 6.6%으로 트리가 50개인 경우와 큰 성능의 차이를 보이지 않아 본 연구에서는 랜덤포레스트 모델의 트리 개수를 50개로 설정하였다. 훈련 기간에 대하여 우수한 성능의 예측 결과(r=0.
대상 데이터
국립산림과학원에서 제공받은 산불 피해 대장 표(발생 일시, 발생장소, 피해면적, 발생원인 등의 정보를 포함) 와 산불 발생 장소 GIS 파일에서 2013년부터 2018년까지의 1 ha 이상의 산불 발생자료(총 241 건)를 가뭄지수 개발 및 검증에 이용하였다.
본 연구에서는 산불 발생 건에 대한 10 가지 가뭄 변수를 경험적 가중 선형조합 방식과 One-class SVM을 적용하여 가뭄지수를 개발하였다. 2013년부터 2017년까지의 1 ha 이상의 산불 발생 건(192 건)에 대해 훈련하고,2018년도 산불 건(49 건)에 대해 검증하였다. 선형 가중치(weight) 적용은 식 (2)와 같이 상관성분석을 통해 선정된 가뭄 변수에 선형적으로 경험적 가중치(α, β, γ)를적용하여 가뭄지수(drought index)를 계산하는 방식이다(Eq.
가뭄지수 개발에 기존 연구에서 제안된 가뭄 인자의 적용을 위해 일 강수량(TRMM 3B42), Terra MODIS에서 제공하는 일 지표 반사도(MOD09GA), 일 지표면온도(MOD11A1)를 이용하였다. Integrated Multi-satellitERetrievals for Global Precipitation Mission(GPM IMERG)가 2014년 7월부터 10 km로 제공되고 있으나 본 연구기간(2013-2018)에 적합하지 않아 TRMM 3B42 강수량을 대신 사용하였다. 강수량으로 인한 가뭄발생은 보통 월 단위(e.
4. Time series of in-situ soil moisture observations, GLDAS 25 km soil moisture, and downscaled 1 km soil moisture based on random forest during the entire year of 2015 for four selected ground stations: Stn 1 (Geochang), Stn 2 (Hwasun), Stn 3 (Jinan) and Stn 4 (Mungyeong).
는 과거 기간 동안의 가장 습윤하고 건조할 때의 후방산란 값을 나타낸다. 본 연구에서는 3-4일 주기 자료의 신뢰도를 높이기 위해 일주일 평균 자료를 이용하였다. 강수량의 경우 토양수분에 미치는 지속기간을 고려하여 5일 및 7일 누적하여 사용하였다.
본 연구에서는 산림청(www.forest.go.kr)에서 제공하 는 1:25000 임상도를 기준으로 비 산림지역을 제외한 우리나라 전 지역을 연구지역으로 선정하였다(Fig. 1). 국립산림과학원에서 제공받은 산불 피해 대장 표(발생 일시, 발생장소, 피해면적, 발생원인 등의 정보를 포함) 와 산불 발생 장소 GIS 파일에서 2013년부터 2018년까지의 1 ha 이상의 산불 발생자료(총 241 건)를 가뭄지수 개발 및 검증에 이용하였다.
다중 위성자료 및 재분석 자료를 이용하여 토양수분다운스케일링 모델 및 가뭄지수를 개발하였다. 토양수분 다운스케일링 모델 개발에 2013년부터 2015년까지의 동안의 GLDAS 일 평균 토양수분 자료(1-10 cm),Meteorological Operational(Metop) Advanced SCATterometter(ASCAT) 의 일 평균 토양수분 자료, Terra Moderate Resolution Imaging Spectroradiometer(MODIS)의 16일 식생지수(MOD13A2), 8일 평균 지표면 온도(MOD11A2)와 Shuttle Radar Topography Mission(SRTM)의 Digital Elevation Model(DEM), TRMM의 일 강수 자료(3B42)를이용하였다(Table 1). GLDAS는 지표모델을 기반으로 한 자료동화 데이터 시스템으로 25 km 공간 해상도의 1-10 cm 토양층의 수분 자료를 3시간 간격으로 제공하며 본 연구에서는 Noah 지표면 모델(land surface model,LSM)의 일 평균값을 이용하였다.
데이터처리
앞선 선형 가중치 적용에 사용된 모든 인자를 입력변수로 하여 커널(kernel)함수는 방사기저함수(Radial basis function, RBF)를 이용하였다. 가중치 적용방식의 결과와 직접적 비교를 위해 모델을 통해 산출된 스코어(score)를 0-0.5로 정규화 하여 결과를 도출하였다.
모델의 성능을 평가하기 위하여 피어슨 상관계수와 RMSE(Root Mean Square Error) 및 rRMSE(relative Root Mean Square Error)를 계산하였다. 모델을 통해 생산된 토양수분 다운스케일링 결과는 농촌진흥청의 2015년도 현장관측 토양수분 자료와 비교하여 추가검증을 진행하였다.
, 2018). 모델의 성능을 평가하기 위하여 피어슨 상관계수와 RMSE(Root Mean Square Error) 및 rRMSE(relative Root Mean Square Error)를 계산하였다. 모델을 통해 생산된 토양수분 다운스케일링 결과는 농촌진흥청의 2015년도 현장관측 토양수분 자료와 비교하여 추가검증을 진행하였다.
이론/모형
본 연구에서는 Park et al.(2017)이 제안한 토양수분 다운스케일링 모델의 흐름을 참고하여 적용하였다. Parket al.
토양수분 다운스케일링 모델 개발에 2013년부터 2015년까지의 동안의 GLDAS 일 평균 토양수분 자료(1-10 cm),Meteorological Operational(Metop) Advanced SCATterometter(ASCAT) 의 일 평균 토양수분 자료, Terra Moderate Resolution Imaging Spectroradiometer(MODIS)의 16일 식생지수(MOD13A2), 8일 평균 지표면 온도(MOD11A2)와 Shuttle Radar Topography Mission(SRTM)의 Digital Elevation Model(DEM), TRMM의 일 강수 자료(3B42)를이용하였다(Table 1). GLDAS는 지표모델을 기반으로 한 자료동화 데이터 시스템으로 25 km 공간 해상도의 1-10 cm 토양층의 수분 자료를 3시간 간격으로 제공하며 본 연구에서는 Noah 지표면 모델(land surface model,LSM)의 일 평균값을 이용하였다.ASCAT은 C-band(5.
NDWI는Gao(1996)이 개발한 변수 중 하나로 NIR과 SWIR 파장 영역의 반사도로 계산된다. SWIR은 수분에 민감한 파장으로 파장 영역에 따라 수분을 감지하는 특성이 다르므로(Wang et al., 2008), MODIS의 SWIR 파장영역에 속하는 밴드5-7을 NDWI 계산에 각각 이용하였다. NDDI는 NDWI와 식생지수로 계산되는 변수로 두 범위의SWIR 파장 영역을 사용함으로써 지면의 건조함을 나타내는 특성을 가지고 있다(Gu et al.
본 연구에서는 위성기반의 가뭄 변수를 이용하여 우리나라에 적합한 산불발생위험을 대변하는 가뭄지수를 개발하였다. 가뭄지수 개발에 앞서 기계학습 기법인랜덤 포레스트 기반의 고해상도 토양수분 자료를 산출하여 가뭄 지수 개발에 이용하였다. 그 외, 수분을 측정할 수 있는 NDWI, NMDI, NDDI, PCI, TCI, VCI를 이용하여 경험적 가중 선형조합과 One-class SVM을 이용하여 가뭄 지수를 개발하였다.
산불관련 가뭄지수 개발에 사용된 변수는 본 연구에서 개발된 고해상도 토양수분과 NDWI5-7 (short wave infrared(SWIR) 파장 영역에 따라 세 가지가 있음), NDDI(Normalized Different DroughtIndex), NMDI(Normalized Multi-band Drought Index), TCI (Temperature Condition Index), VCI (Vegetation Condition Index) 그리고 PCI(Precipitation Condition Index)이다(Table 2). NDWI는Gao(1996)이 개발한 변수 중 하나로 NIR과 SWIR 파장 영역의 반사도로 계산된다.
기존의 이진분류 SVM을 사용하여 기계학습 모델을 개발할 경우 산불 비 발생 샘플 추출에 대한 개발자의 주관적인 견해가 포함되므로 본 연구에서는 기계학습 기법 중 하나인 One-Class SVM을 통한 산불 발생과 관련된 가뭄지수 또한 개발하였다. 앞선 선형 가중치 적용에 사용된 모든 인자를 입력변수로 하여 커널(kernel)함수는 방사기저함수(Radial basis function, RBF)를 이용하였다. 가중치 적용방식의 결과와 직접적 비교를 위해 모델을 통해 산출된 스코어(score)를 0-0.
성능/효과
10 ha 이상에도 1 ha와 같은 상관성을 보였으며 상대적으로 비 가뭄인 경우가 적었고(Fig. 5(b)),특히 산불면적이 50 ha 이상인 경우(총 9 건)에는 각 인자 별 평균값은 토양수분이 0.37, NDDI 0.49, NDWI50.32, NDWI6 0.28, NDWI7 0.38, NMDI 0.41, TCI 0.45,VCI 0.56, PCI1 0.01, PCI2 0.02를 나타내는 등 가뭄과 더 큰 상관성을 나타냈다. 다시 말해, 산불 피해면적이 커질수록 각 가뭄 변수의 값이 낮아지는 즉 건조해지는 경향을 보였으며, 이와 같은 결과는 기존 연구의 결과와 일치하였다(Andrews et al.
값이 1에 가까울수록 가뭄이 아닌 상태(wet)를, 0에 가까울수록 가뭄이 심각함(dry)을 의미한다. 1 ha이상에서는 일주일 누적 강수량 (PCI1)과 2주 누적 강수량 (PCI2) 값의 범위가 가장 가뭄 현상을 잘 나타냈고, 순서대로 토양수분(SM), NDWI 등이 상관성 있는 분포를 보였다. NDDI와 NMDI, VCI는 비가뭄에 가까운 값을 모여 산불발생에는 상관성이 떨어지는 것을 보였다(Fig.
1 ha이상에서는 일주일 누적 강수량 (PCI1)과 2주 누적 강수량 (PCI2) 값의 범위가 가장 가뭄 현상을 잘 나타냈고, 순서대로 토양수분(SM), NDWI 등이 상관성 있는 분포를 보였다. NDDI와 NMDI, VCI는 비가뭄에 가까운 값을 모여 산불발생에는 상관성이 떨어지는 것을 보였다(Fig. 5(a)).
,2014). TCI, NMDI를 포함한 가중 선형조합은(스킴 2,스킴 3) 2018년의 49 건(1 ha 이상)의 산불건에 대해 6건의 산불에 대해 비 가뭄상태를 나타내어(12% 오류), 다른스킴에 비해 약두배 이상의 오류를 보였다. 또한 스킴2와 스킴 3은 산불 면적이 50 ha가 넘는 지역에 대해서도 비 가뭄을 나타냈다(3 건 중 2 건 오류).
각각의 인자를 사용했을 때보다 여러 인자를 조합한 다섯 가지 스킴이 가뭄을 더 잘 대변하는 것으로 나타났다. 2018년 산불 발생 건(49건)에 대해 적용한 결과,기존의 각 인자의 범위가 0-1이었던 것에 비해 조합한 경우에는 최대 0.
그 외, 수분을 측정할 수 있는 NDWI, NMDI, NDDI, PCI, TCI, VCI를 이용하여 경험적 가중 선형조합과 One-class SVM을 이용하여 가뭄 지수를 개발하였다. 경험적 가중 선형조합에 있어서는 토양수분, NDWI를 기반으로 조합했을 때 산불 발생과 관련성이 높게 나타났으며, One-class SVM이용에서는 산불 피해면적이 넓은 건에 대해서 적합함을 보였다.
또한 스킴2와 스킴 3은 산불 면적이 50 ha가 넘는 지역에 대해서도 비 가뭄을 나타냈다(3 건 중 2 건 오류). 따라서 가뭄으로 인한 산불위험지역을 산정한다면, 경험적 가중 선형조합 중 토양수분과 NDWI의 조합(스킴 1), 토양수분,NDWI와 강수량의 조합(스킴 4), 토양수분, NDWI, 강수량과 온도의 조합(스킴 5)이 가능할 것으로 보인다. One-class SVM의 경우 1 ha 이상 30 ha 미만의 산불 건에 대해 오류가 있어 상대적으로 산불 피해면적이 넓은 지역에 대해 사용이 가능할 것으로 보인다.
본 연구의 결과는 우리나라에 적합한 토양수분 다운 스케일링을 통해 고해상도의 토양수분 정보를 반영한 산불발생위험을 대변하는 가뭄지수를 개발하였을 뿐만 아니라, One-class SVM 기계학습을 이 분야에 최초로 적용해봤다는 의미가 있다. 두 가지 기법 모두 유의미한 결과를 보였으나 추후 더 많은 현장자료를 이용한다면 정확도를 높일 수 있을 것으로 예상되며, 산불피해면적에 대한 정확한 GIS 정보가 있다면 모델 개선이 가능할 것으로 기대된다.
실제 산불발생 건에 대해 10가지 가뭄 변수와의 상관성 분석을 통해 PCI1과 PCI2가 가장 큰 영향이 있는 것으로 나타났다. 하지만 PCI를 시공간적으로 분석해본 결과, 강수의 발생 유무에 따라 값의 편차가 크고(0 또는 1에 가까운 값을 가짐) 공간적 편차가 적은 경향을 보였다.
실제 산불발생 건에 대해 10가지 가뭄 변수와의 상관성 분석을 통해 PCI1과 PCI2가 가장 큰 영향이 있는 것으로 나타났다. 하지만 PCI를 시공간적으로 분석해본 결과, 강수의 발생 유무에 따라 값의 편차가 크고(0 또는 1에 가까운 값을 가짐) 공간적 편차가 적은 경향을 보였다. 따라서 본 연구에서는 경험적 가중 선형조합에 있어 강수량 다음으로 상관성이 높았던 토양수분 및NDWI를 기준으로(스킴 1(Scheme 1)), 토양과 식생의 수분에 영향을 끼칠 수 있는 온도를 반영한 스킴 2,SWIR 파장 영역의 수분 탐지를 극대화하여 토양 뿐만 아니라 식생의 수분을 탐지할 수 있는 스킴 3, 강수량의 충분 및 부족을 반영한 스킴 4, 온도와 강수를 모두 고려한 스킴 5에 대해 수행하였으며(Table 3), 각각의 가중치는 가중치의 합이 1이 되게 각 인자들의 가중치를 0.
4는 2015년 1월 1일부터 12월 31일까지의 현장관측기반 토양수분 자료, 종속변수인 GLDAS 토양수분 자료, 그리고 다운스케일링 모델로부터 예측되는 토양수분 자료의 시계열 분포를 나타낸다. 해당 4개의 관측소에서 모델 결과와 종속 변수 간의 증감 패턴이 유사하게 나타나는 것을 확인하였다. 단 앞서 Fig.
6%으로 트리가 50개인 경우와 큰 성능의 차이를 보이지 않아 본 연구에서는 랜덤포레스트 모델의 트리 개수를 50개로 설정하였다. 훈련 기간에 대하여 우수한 성능의 예측 결과(r=0.91)를 보였으나 전체적으로 높은 토양수분 값에 대해서는 실제보다 낮게 예측하고 낮은 토양수분 값에 대해서는 높게 예측하는 것과 같이 극 값에 대한 모의가 부족하였다. 이는 극 값에 대한 훈련 자료 부족 및 랜덤 포레스트 회귀모델이 여러 트리의 예측 값을 평균하여 최종 값을 산정하는 구조에 의한 한계점으로 보여지며, 향후 극 값에 대해 오버샘플링(oversampling)한 후 모델을 훈련하여 한계점을 개선할 수 있다(Torgo et al.
후속연구
본 연구의 결과는 우리나라에 적합한 토양수분 다운 스케일링을 통해 고해상도의 토양수분 정보를 반영한 산불발생위험을 대변하는 가뭄지수를 개발하였을 뿐만 아니라, One-class SVM 기계학습을 이 분야에 최초로 적용해봤다는 의미가 있다. 두 가지 기법 모두 유의미한 결과를 보였으나 추후 더 많은 현장자료를 이용한다면 정확도를 높일 수 있을 것으로 예상되며, 산불피해면적에 대한 정확한 GIS 정보가 있다면 모델 개선이 가능할 것으로 기대된다. 또한, 현재 제공되고 있는 Suomi NPOESS Preparatory Project(S-NPP)의 Visible Infrared Imaging Radiometer Suite(VIIRS) 산출물, GPMIMERG 강수량과 추후 발사예정인 수자원 위성의 C 밴드를 사용하면 고해상도의 가뭄지수 생산이 가능하여 산불발생지역에 있어 상대적으로 정확한 정보를 얻을 수 있을 것으로 기대된다.
두 가지 기법 모두 유의미한 결과를 보였으나 추후 더 많은 현장자료를 이용한다면 정확도를 높일 수 있을 것으로 예상되며, 산불피해면적에 대한 정확한 GIS 정보가 있다면 모델 개선이 가능할 것으로 기대된다. 또한, 현재 제공되고 있는 Suomi NPOESS Preparatory Project(S-NPP)의 Visible Infrared Imaging Radiometer Suite(VIIRS) 산출물, GPMIMERG 강수량과 추후 발사예정인 수자원 위성의 C 밴드를 사용하면 고해상도의 가뭄지수 생산이 가능하여 산불발생지역에 있어 상대적으로 정확한 정보를 얻을 수 있을 것으로 기대된다.
(2015)은식생 캐노피(canopy) 수분을 나타내는 위성기반의 지수인 NDWI(Normalized Difference Water Index)의 아노말리(anomaly)가 음의 값, 즉 건조한 상태를 나타낼 때 대형 산불이 빈번하게 발생하는 것을 확인하였다. 음의 아노말리의 심도와 대형산불 발생 여부가 불일치하는 사례 등을 한계점으로 언급하며 향후 더 다양한 기상인자와 생태변수들이 고려되어야 함을 나타냈다. 국외의 경우 Keetch and Byram(1968)이 제안한 KBDI 등의 기존지수를 각 지역에 맞게 계수 값을 조정하는 등 기존 단일 지수를 개선시키는 방향의 연구가 많이 진행되어 오고 있다(Ganatsas et al.
하지만 소규모의 산불발생위험을 탐지하는데 있어 가뭄지수의 해상도가 상대적으로 낮아 가뭄의 정보를 제대로 반영하기 힘들다는 점과(공간정보의 한계) 전체 산불에 대한 자료 양(샘플 수)의 한계로 인해 모델 결과에 오류가 발생하였다. 추후 고해상도(1km 미만)의 입력변수와 더 많은 산불발생 정보가 제공된다면 가뭄지수의 개선이 가능할 것으로 기대된다.
질의응답
핵심어
질문
논문에서 추출한 답변
One-Class SVM은 어떻게 one class와 이상 치 (outlier)를 구분하는가?
One-Class SVM은 기존의 이진분류 및 다중분류 SVM과동일하게 초평면(hyperplane)을 이용하여 one class와 이상 치 (outlier)를 구분한다 (Zhang et al., 2009).
산불관련 가뭄지수 중 하나인 NDDI의 특성은 무엇인가?
, 2008), MODIS의 SWIR 파장영역에 속하는 밴드5-7을 NDWI 계산에 각각 이용하였다. NDDI는 NDWI와 식생지수로 계산되는 변수로 두 범위의SWIR 파장 영역을 사용함으로써 지면의 건조함을 나타내는 특성을 가지고 있다(Gu et al., 2007; Kong et al.
랜덤 포레스트 모델의 특징은 무엇인가?
본 연구에서는GLDAS 토양수분 자료의 공간상세화를 위하여 2013-2014년 기간 동안의 ASCAT 토양수분, 8일 합성 지표면 온도, 16일 합성 식생지수, SRTM의 DEM, 5일 누적 강수량과 7일 누적 강수량을 입력변수로 하여 랜덤 포레스트(Random Forest) 기반의 토양수분 다운스케일링 모델을 개발하였다. 사용한 랜덤 포레스트 모델은 훈련 과정에서 독립적인 결정트리(Decision Tree) 그룹을 구성하여 앙상블 기법을 통해 입력변수로부터 종속 변수의 값을 예측하는 기계학습 기법 중 하나이며(Breiman, 2001),기존의 기계학습 기반의 위성 산출물 다운스케일링 연구에서 다른 기계학습 기법 보다 상대적으로 우수한 성능을 보였다(Im et al., 2016; Ke et al.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.