$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

땅밀림 위험지 평가를 위한 기계학습 분류모델 비교
A Performance Comparison of Machine Learning Classification Methods for Soil Creep Susceptibility Assessment 원문보기

한국산림과학회지 = Journal of korean society of forest science, v.110 no.4, 2021년, pp.610 - 621  

이제만 (서울대학교 농림생물자원학부) ,  서정일 (공주대학교 산림과학과) ,  이진호 (한국치산기술협회 연구조사처) ,  임상준 (서울대학교 농림생물자원학부)

초록
AI-Helper 아이콘AI-Helper

지진 발생과 집중호우에 의해 땅밀림형 산사태 유형으로 분류되는 땅밀림 현상이 전국적으로 광범위하게 나타나고 있다. 산림청은 땅밀림으로 인한 인명 및 재산 피해를 예방하기 위해 땅밀림 우려지 현장조사 판정표를 통해 땅밀림 발생 위험지를 사전에 파악하고 있다. 한편 최근에는 컴퓨터 기술의 발달로 인공지능의 한 분야인 기계학습 분류기법을 이용하여 산지재해 취약성을 평가하거나 자연재해를 예측하고 있다. 따라서 이 연구에서는 기계학습 분류기법인 k-Nearest Neighbor(k-NN), Naive Bayes(NB), Random Forest(RF), 그리고 Support Vector Machine(SVM) 분류모델을 이용하여 땅밀림 발생 위험등급을 분류하였다. 한국치산기술협회의 2018~2020년 조사 자료 4,618개 중에서 땅밀림 현상의 발생 여부를 고려하여 발생지 총 146개소, 그리고 미발생지 146개소를 임의추출하여 292개 자료를 선정하였으며, 이 중 70%에 해당하는 204개소 자료를 훈련자료로 하여 모델을 구축하였다. 전체 자료의 30%에 해당하는 88개 검증자료에 대해 모델을 평가한 결과, k-NN은 0.727, NB는 0.750, RF는 0.807, 그리고 SVM은 0.750의 분류정확도를 보였다. 또한, Kappa 상관계수는 각각 0.534, 0.580, 0.673 및 0.585, 그리고 AUC는 각각 0.872, 0.912, 0.943 및 0.834로 계산되었다. 따라서 땅밀림 위험지역 판정을 위한 기계학습 분류모델은 RF, NB, SVM, 그리고 k-NN 순으로 높은 성능을 보였다. 기계학습 분류모델은 향후 산지토사재해의 예방 및 대응을 위한 기초자료로 활용 가능하며, 땅밀림 재해 관리 및 피해 경감에 위한 정책 개발에 필요한 정보를 제공할 것이다.

Abstract AI-Helper 아이콘AI-Helper

The soil creep, primarily caused by earthquakes and torrential rainfall events, has widely occurred across the country. The Korea Forest Service attempted to quantify the soil creep susceptible areas using a discriminant value table to prevent or mitigate casualties and/or property damages in advanc...

주제어

표/그림 (9)

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 따라서, 이 연구에서는 땅밀림 발생지를 판정하기 위해 땅밀림지에서 현장조사된 자료를 이용하여 기계학습 기반의 k-NN, Naive Bayes(NB), RF, SVM 분류모델을 개발하고, 개발된 땅밀림 분류모델의 분류정확도 및 성능을 비교하여 기계학습 기반 땅밀림 위험지 평가방법을 제시하고자 하였다.
본문요약 정보가 도움이 되었나요?

참고문헌 (47)

  1. Althnian, A., AlSaeed, D., Al-Baity, H., Samha, A., Dris, A.B., Alzakari, N., Elwafa, A.A. and Kurdi, H. 2021. Impact of dataset size on classification performance: An empirical evaluation in the medical domain. Applied Sciences 11(2): 796. 

  2. Beyene, C. and Kamat, P. 2018. Survey on prediction and analysis the occurrence of heart disease using data mining techniques. International Journal of Pure and Applied Mathematics 118(8): 165-174. 

  3. Breiman, L. 1996. Bagging predictors. Machine Learning 24(2): 123-140. 

  4. Breiman, L. 2001. Random forests. Machine Learning 45(1): 5-32. 

  5. Cohen, J. 1968. Weighted kappa: Nominal scale agreement provision for scaled disagreement or partial credit. Psychological Bulletin 70(4): 213. 

  6. Cortes, C. and Vapnik, V. 1995. Support-vector networks. Machine Learning 20(3): 273-297. 

  7. Cover, T. and Hart, P. 1967. Nearest neighbor pattern classification. IEEE Transactions on Information Theory 13(1): 21-27. 

  8. Fairbridge, R.W. 1968. Soil creep. In: Geomorphology. Encyclopedia of Earth Science. Springer, Berlin, Heidelberg. 

  9. Heckmann, T., Grgg, K., Gegg, A. and Becht, M. 2013. Sample size matters: Investigating the effect of sample size on a logistic regression debris flow susceptibility model. Natural Hazards and Earth System Sciences 1: 2731-2779. 

  10. Hu, L.Y., Huang, M.W., Ke, S.W. and Tsai, C.F. 2016. The distance function effect on k-nearest neighbor classification for medical datasets. SpringerPlus 5(1): 1-9. 

  11. Huang, S., Huang, M. and Lyu, Y. 2020. An improved KNNbased slope stability prediction model. Advances in Civil Engineering 2020: 8894109. 

  12. Imandoust, S.B. and Bolandraftar, M. 2013. Application of k-nearest neighbor (kNN) approach for predicting economic events: Theoretical background. International Journal of Engineering Research and Applications 3(5): 605-610. 

  13. Kadavi, P.R., Lee, C.W. and Lee, S. 2019. Landslidesusceptibility mapping in Gangwon-do, South Korea, using logistic regression and decision tree models. Environmental Earth Sciences 78(4): 116. 

  14. Kang, K.H. 2019. Analysis of landslide susceptibility for Sangju and Jinbu areas using random forest model. (Dissertation). Seoul. Sejong University. 

  15. Kim, J.H. 2019. Multicollinearity and misleading statistical results. Korean Journal of Anesthesiology 72(6): 558. 

  16. Korea Forest Service. 2018. Development of extraction for land ereep susceptiile zones and field survey techniques. pp. 633. 

  17. Landis, J.R. and Koch, G.G. 1977. The measurement of observer agreement for categorical data. Biometrics. 159-174. 

  18. Lantz, B. 2013. Machine learning with R. Packt Publishing Ltd. 

  19. Lee, J.E. 2020. A study on improvement of map generalization using machine learning: Focusing on selective omission of building and road data. (Dissertation). Seoul. Seoul National University. 

  20. Lee, J.M. 2021. Assessment of soil creep susceptibility using machine learning classification algorithms. (Dissertation). Seoul. Seoul National University. 

  21. Lee, M.S., Park, J.H. and Park, Y.S. 2019. Analysis o f characteristics using geotechnical investigation on the slow-moving landslides in the Pohang-si area. Journal of Korean Society of Forest Science 108(2): 233-240. 

  22. Liaw, A. and Wiener, M. 2002. Classification and regression by random forest. R News 2(3): 18-22. 

  23. Liu, S. and Zhang, Z. 2017. A multi-stage prediction KNN algorithm based on center vector. Computer Engineering and Science 39(9): 1758-1764. 

  24. Marjanovic, M., Bajat, B. and Kovacevic, M. 2009. Landslide susceptibility assessment with machine learning algorithms. In 2009 International Conference on Intelligent Networking and Collaborative Systems, IEEE. 273-278. 

  25. Maroco, J., Silva, D., Rodrigues, A., Guerreiro, M., Santana, I. and de Mendonca, A. 2011. Data mining methods in the prediction of dementia: A real-data comparison of the accuracy, sensitivity and specificity of linear discriminant analysis, logistic regression, neural networks, support vector machines, classification trees and random forests. BMC Research Notes 4(1): 1-14. 

  26. Merghadi, A., Yunus, A.P., Dou, J., Whiteley, J., Thaipham, B., Bui, D.T., Avtar, R. and Abderrahmane, B. 2020. Machine learning methods for landslide susceptibility studies: A comparative overview of algorithm performance. Earth-Science Reviews 207: 103-225. 

  27. Mitchell, T.M. 1997. Does machine learning really work? AI Magazine 18(3): 11-11. 

  28. Muller, A.C. and Guido, S. 2016. Introduction to machine learning with Python: A guide for data scientists. O'Reilly Media, Inc. 

  29. Oh, H.J., Lee, S. and Hong, S.M. 2017. Landslide susceptibility assessment using frequency ratio technique with iterative random sampling. Journal of Sensors. 2017. 

  30. Park, J.H. 2018. What's land creep. Korean Society of Forest Environment Research 21: 96-107. 

  31. Park, J.H. and Park, S.G. 2020. Analysis of tree-rings for inference of periods in which slow-moving landslides occur. Journal of Korean Society of Forest Science 109(1): 62-71. 

  32. Park, J.H., Lee, C.W., Kang, M.J. and Kim, K.D. 2015. Analysis of characteristics of forest environmental factors on land creeping occurrence. Journal of Agriculture and Life Sciences 49(5): 133-144. 

  33. Park, J.H., Seo, J.I. and Lee, C.W. 2019b. Analysis of GIS for characteristics on the slow-moving landslide: With a special reference on slope and grade of landslide. Journal of Korean Society of Forest Science 108(3): 311-321. 

  34. Park, J.H., Seo, J.I., Ma, H.S., Kim, D.Y., Kang, M.J. and Kim, K.D. 2019a. Topography and soil characteristics related to land creep in 37 areas in South Korea. Journal of Korean Society of Forest Science 108(4): 540-551. 

  35. Pourghasemi, H.R., Jirandeh, A.G., Pradhan, B., Xu, C. and Gokceoglu, C. 2013. Landslide susceptibility mapping using support vector machine and GIS at the Golestan Province, Iran. Journal of Earth System Science 122(2): 349-369. 

  36. Rahmati, O., Haghizadeh, A., Pourghasemi, H.R. and Noormohamadi, F. 2016. Gully erosion susceptibility mapping: The role of GIS-based bivariate statistical models and their comparison. Natural Hazards 82(2) 1231-1258. 

  37. Raudys, S.J. and Jain, A.K. 1991. Small sample size effects in statistical pattern recognition: Recommendations for practitioners. IEEE Transactions on Pattern Analysis and Machine Intelligence 13(3): 252-264. 

  38. Rodriguez-Galiano, V.F., Ghimire, B., Rogan, J., Chica-Olmo, M. and Rigol-Sanchez, J.P. 2012. An assessment of the effectiveness of a random forest classifier for landcover classification. ISPRS Journal of Photogrammetry and Remote Sensing 67: 93-104. 

  39. Sammut, C. and Webb, G.I. 2011. Encyclopedia of machine learning. Springer Science & Business Media. 

  40. Statnikov, A., Wang, L. and Aliferis, C.F. 2008. A comprehensive comparison of random forests and support vector machines for microarray-based cancer classification. BMC Bioinformatics 9(1): 1-10. 

  41. Tehrany, M.S., Pradhan, B., Mansor, S. and Ahmad, N. 2015. Flood susceptibility assessment using GIS-based support vector machine model with different kernel types. Catena 125: 91-101. 

  42. Tsangaratos, P. and Ilia, I. 2016. Comparison of a logistic regression and naive bayes classifier in landslide susceptibility assessments: The influence of models complexity and training dataset size. Catena 145: 164-179. 

  43. Vabalas, A., Gowen, E., Poliakoff, E. and Casson, A.J. 2019. Machine learning algorithm validation with a limited sample size. PloS One 14(11): e0224365. 

  44. Vasu, N.N. and Lee, S.R. 2016. A hybrid feature selection algorithm integrating an extreme learning machine for landslide susceptibility modeling of Mt. Woomyeon, South Korea. Geomorphology 263: 50-70. 

  45. Woo, B.M., Park, J.H. Choi, H.T. Jeon, G.S. and Kim, K.H. 1996. Articles: A study on the characteristics of the landslide in Hyuseok-dong (I): Geological and hydrological characteristics. Journal of Korean Society of Forest Science 85(4): 571-576. 

  46. Xiong, J., Sun, M., Zhang, H., Cheng, W., Yang, Y., Sun, M., Cao, Y. and Wang, J. 2019. Application of the Levenburg-Marquardt back propagation neural network approach for landslide risk assessments. Natural Hazards and Earth System Sciences 19(3): 629-653. 

  47. Xu, C., Dai, F., Xu, X. and Lee, Y.H. 2012. GIS-based support vector machine modeling of earthquake-triggered landslide susceptibility in the Jianjiang River watershed, China. Geomorphology 145: 70-80. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로