랜덤 포레스트와 부스티드 트리 모델을 적용한 서울의 홍수와 산사태 취약성 분석 Spatial Analysis of Flood and Landslide Susceptibility in Seoul using Random Forest and Boosted Tree Models원문보기
본 연구에서는 홍수와 산사태에 영향을 미치는 수리수문학 및 지형, 토양, 임상학적 요인들을 분석하고 이를 근거로 홍수와 산사태 발생원인의 예측 중요도 값을 계산하여, 이를 통해 각각의 연구지역에 대해 취약성도를 작성하였다. 연구대상지역은 최근 여름철 폭우로 인한 홍수와 산사태 피해가 발생한 지역인 서울특별시이며, 홍수 취약성 분석은 서울특별시 전체를 대상으로 하였고, 산사태 취약성 분석은 2011년 산사태로 큰 피해가 발생한 서울특별시 서초구 우면산 일대를 연구지역으로 하였다. 홍수 취약성 분석을 위해 현장조사를 통해 취득된 2010년과 2011년 홍수 침수 피해지역 데이터를 취득하였고, 1:5000 지형도, 1:25000 토지이용도, 1:25000 ...
본 연구에서는 홍수와 산사태에 영향을 미치는 수리수문학 및 지형, 토양, 임상학적 요인들을 분석하고 이를 근거로 홍수와 산사태 발생원인의 예측 중요도 값을 계산하여, 이를 통해 각각의 연구지역에 대해 취약성도를 작성하였다. 연구대상지역은 최근 여름철 폭우로 인한 홍수와 산사태 피해가 발생한 지역인 서울특별시이며, 홍수 취약성 분석은 서울특별시 전체를 대상으로 하였고, 산사태 취약성 분석은 2011년 산사태로 큰 피해가 발생한 서울특별시 서초구 우면산 일대를 연구지역으로 하였다. 홍수 취약성 분석을 위해 현장조사를 통해 취득된 2010년과 2011년 홍수 침수 피해지역 데이터를 취득하였고, 1:5000 지형도, 1:25000 토지이용도, 1:25000 토양도, 1:25000 지질도를 통해 홍수 발생에 영향을 미치는 요인들을 추출하여 공간데이터베이스를 구축하였다. 산사태 취약성 분석을 위해서는 산사태 발생위치 정보를 산사태 이후 항공사진 분석을 통해서 취득하였으며, 1:5000 지형도, 1:25000 토지이용도, 1:25000 토양도, 1:25000 지질도 및 1:25000 임상도를 통해 관련 요인을 추출하고 마찬가지로 공간데이터베이스를 구축하였다. 이렇게 구축된 산사태와 홍수 발생위치 및 홍수 발생요인 공간데이터베이스를 랜덤 포레스트(Random forest)와 부스티드 트리(Boosted tree) 모델 및 산사태 각각의 발생요인 공간데이터베이스를 부스티드 트리 모델에 적용하여 분류분석과 회귀분석을 각각 수행하였다. 이 단계에서 각 모델마다의 각각의 발생요인에 대한 예측 중요도 값을 각각 계산하였으며, 홍수와 산사태 취약성도를 작성하였다. 마지막으로 계산된 홍수와 산사태 취약성 지수가 기존의 홍수와 산사태 발생을 설명할 수 있는지 정량적으로 검증하기 위해 ROC (Receiver Operation Characteristic Curve) 곡선을 작성하여 각 취약성도의 신뢰도를 검증하였다. 각각의 모델에 해당하는 검증 결과, 서울 지역에서의 홍수 취약성 예측 지도를 검증하기 위해 ROC 곡선 작성 및 AUC를 계산하였다. 각각에 대해 AUC를 계산한 결과 랜덤 포레스트 모델은 회귀 분석에서는 78.78 % (0.7878)의 정확도를 보인 반면, 분류 분석에서는 79.18 % (0.7918)의 정확도를 보였다. 부스티드 트리 모델의 경우에는 회귀 분석에서 77.55 % (0.7755)의 정확도를 보인 반면, 분류 분석에서는 77.26 % (0.7726)의 정확도를 보였다. 마찬가지로 부스티드 트리 모델을 이용한 우면산 지역의 산사태 취약성 예측 값을 검증하기 위해 ROC 곡선 작성하고 AUC를 계산하였다. 분류 분석과 회귀 분석 결과 각각의 ROC 곡선에 대해 AUC를 계산한 결과 회귀 분석에서 83.50% (0.8350)의 정확도를 보인 반면, 분류 분석에서는 83.18% (0.8318)의 정확도를 보였다. 본 연구는 국가 기반으로 구축된 기존 데이터를 활용하여 국내의 수도인 서울지역을 연구지역으로 설정하여 수행하였으며, 추후에는 국내의 다른 도심지 및 기타 지역에의 적용으로 전국적으로 취약성도를 제작하여 홍수 및 산사태 피해를 사전에 예방할 수 있도록 한다. 또한 이와 같은 결과를 통해 국가적으로 홍수방어대책, 방재사업, 토지이용계획 등의 수립을 위한 정량적 자료로써 적용 및 활용될 수 있을 것으로 기대된다.
본 연구에서는 홍수와 산사태에 영향을 미치는 수리수문학 및 지형, 토양, 임상학적 요인들을 분석하고 이를 근거로 홍수와 산사태 발생원인의 예측 중요도 값을 계산하여, 이를 통해 각각의 연구지역에 대해 취약성도를 작성하였다. 연구대상지역은 최근 여름철 폭우로 인한 홍수와 산사태 피해가 발생한 지역인 서울특별시이며, 홍수 취약성 분석은 서울특별시 전체를 대상으로 하였고, 산사태 취약성 분석은 2011년 산사태로 큰 피해가 발생한 서울특별시 서초구 우면산 일대를 연구지역으로 하였다. 홍수 취약성 분석을 위해 현장조사를 통해 취득된 2010년과 2011년 홍수 침수 피해지역 데이터를 취득하였고, 1:5000 지형도, 1:25000 토지이용도, 1:25000 토양도, 1:25000 지질도를 통해 홍수 발생에 영향을 미치는 요인들을 추출하여 공간데이터베이스를 구축하였다. 산사태 취약성 분석을 위해서는 산사태 발생위치 정보를 산사태 이후 항공사진 분석을 통해서 취득하였으며, 1:5000 지형도, 1:25000 토지이용도, 1:25000 토양도, 1:25000 지질도 및 1:25000 임상도를 통해 관련 요인을 추출하고 마찬가지로 공간데이터베이스를 구축하였다. 이렇게 구축된 산사태와 홍수 발생위치 및 홍수 발생요인 공간데이터베이스를 랜덤 포레스트(Random forest)와 부스티드 트리(Boosted tree) 모델 및 산사태 각각의 발생요인 공간데이터베이스를 부스티드 트리 모델에 적용하여 분류분석과 회귀분석을 각각 수행하였다. 이 단계에서 각 모델마다의 각각의 발생요인에 대한 예측 중요도 값을 각각 계산하였으며, 홍수와 산사태 취약성도를 작성하였다. 마지막으로 계산된 홍수와 산사태 취약성 지수가 기존의 홍수와 산사태 발생을 설명할 수 있는지 정량적으로 검증하기 위해 ROC (Receiver Operation Characteristic Curve) 곡선을 작성하여 각 취약성도의 신뢰도를 검증하였다. 각각의 모델에 해당하는 검증 결과, 서울 지역에서의 홍수 취약성 예측 지도를 검증하기 위해 ROC 곡선 작성 및 AUC를 계산하였다. 각각에 대해 AUC를 계산한 결과 랜덤 포레스트 모델은 회귀 분석에서는 78.78 % (0.7878)의 정확도를 보인 반면, 분류 분석에서는 79.18 % (0.7918)의 정확도를 보였다. 부스티드 트리 모델의 경우에는 회귀 분석에서 77.55 % (0.7755)의 정확도를 보인 반면, 분류 분석에서는 77.26 % (0.7726)의 정확도를 보였다. 마찬가지로 부스티드 트리 모델을 이용한 우면산 지역의 산사태 취약성 예측 값을 검증하기 위해 ROC 곡선 작성하고 AUC를 계산하였다. 분류 분석과 회귀 분석 결과 각각의 ROC 곡선에 대해 AUC를 계산한 결과 회귀 분석에서 83.50% (0.8350)의 정확도를 보인 반면, 분류 분석에서는 83.18% (0.8318)의 정확도를 보였다. 본 연구는 국가 기반으로 구축된 기존 데이터를 활용하여 국내의 수도인 서울지역을 연구지역으로 설정하여 수행하였으며, 추후에는 국내의 다른 도심지 및 기타 지역에의 적용으로 전국적으로 취약성도를 제작하여 홍수 및 산사태 피해를 사전에 예방할 수 있도록 한다. 또한 이와 같은 결과를 통해 국가적으로 홍수방어대책, 방재사업, 토지이용계획 등의 수립을 위한 정량적 자료로써 적용 및 활용될 수 있을 것으로 기대된다.
Since natural hazard frequency increases with the impact of climate change, the damage that is emphasized on risk maps is based on actual data; therefore, flood-susceptibility maps for the Seoul metropolitan area, for which random-forest and boosted-tree models and landslide-susceptibility maps for ...
Since natural hazard frequency increases with the impact of climate change, the damage that is emphasized on risk maps is based on actual data; therefore, flood-susceptibility maps for the Seoul metropolitan area, for which random-forest and boosted-tree models and landslide-susceptibility maps for the Mt. Umyeon area, for which boosted-tree model are used in a geographic information system (GIS) environment, are created for this study. For the flood-susceptibility mapping, flooded-area, topography, geology, soil, and land-use data were collected and topography, soil, forestry data for the landslide-susceptibility were collected and entered into a spatial database. From the database, respectively 12 and 21 factors were calculated and extracted as the input data for the models. The flooded area of 2010 was used to train the model, and the flooded area of 2011 was used for the validation. For the landslide-susceptibility, 2011 landslide data in Mt. Umyeon was used for both training and validation. The importance of the factors of the susceptibility maps were calculated, and lastly, the maps were validated. As a result, for the flood-susceptibility, the distance from the river, geology, and DEM showed a high importance among the factors. The Random forest and Boosted tree models showed validation accuracies of 78.78% and 79.18% and 77.55% and 77.26%, respectively, for the regression and classification algorithms, respectively. For the landslide-susceptibility, by using Boosted tree model, SLF, standard height, timber type, slope showed a high importance and boosted-tree model showd validation accuracies of 83.50% and 83.18%, respectively, for the regression and classification algorithms, respectively. The susceptibility maps provide meaningful information for decision-makers regarding the identification of priority areas for natural hazard mitigation management.
Since natural hazard frequency increases with the impact of climate change, the damage that is emphasized on risk maps is based on actual data; therefore, flood-susceptibility maps for the Seoul metropolitan area, for which random-forest and boosted-tree models and landslide-susceptibility maps for the Mt. Umyeon area, for which boosted-tree model are used in a geographic information system (GIS) environment, are created for this study. For the flood-susceptibility mapping, flooded-area, topography, geology, soil, and land-use data were collected and topography, soil, forestry data for the landslide-susceptibility were collected and entered into a spatial database. From the database, respectively 12 and 21 factors were calculated and extracted as the input data for the models. The flooded area of 2010 was used to train the model, and the flooded area of 2011 was used for the validation. For the landslide-susceptibility, 2011 landslide data in Mt. Umyeon was used for both training and validation. The importance of the factors of the susceptibility maps were calculated, and lastly, the maps were validated. As a result, for the flood-susceptibility, the distance from the river, geology, and DEM showed a high importance among the factors. The Random forest and Boosted tree models showed validation accuracies of 78.78% and 79.18% and 77.55% and 77.26%, respectively, for the regression and classification algorithms, respectively. For the landslide-susceptibility, by using Boosted tree model, SLF, standard height, timber type, slope showed a high importance and boosted-tree model showd validation accuracies of 83.50% and 83.18%, respectively, for the regression and classification algorithms, respectively. The susceptibility maps provide meaningful information for decision-makers regarding the identification of priority areas for natural hazard mitigation management.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.