$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

머신러닝기반 범죄발생 위험지역 예측
Predicting Crime Risky Area Using Machine Learning 원문보기

한국지리정보학회지 = Journal of the Korean Association of Geographic Information Studies, v.21 no.4, 2018년, pp.64 - 80  

허선영 (경상대학교 공학연구원) ,  김주영 ((주)동명기술공단종합건축사사무소 도시사업본부 도시계획부) ,  문태헌 (경상대학교 도시공학과)

초록
AI-Helper 아이콘AI-Helper

우리나라의 시민들은 범죄에 대한 일반적인 사항만을 알 수 있을 뿐, 자신이 범죄위험에 얼마나 노출되어 있는지를 파악하기 어렵다. 경찰의 입장에서도 범죄발생 지역을 예측할 수 있다면 경찰력이 부족한 상황에서 효율성 있게 범죄에 대처 가능할 것이지만 아직 우리나라에서는 예측시스템이 없고, 관련 연구도 매우 부족한 실정이다. 이에 본 연구에서는 범죄발생 위험지역 예측 자동화 시스템 개발의 첫 번째 단계로 빅데이터로 구축 가능한 범죄정보와 도시지역 자료를 바탕으로 머신러닝 방식을 통해 한국형 범죄발생 위험지역 예측 모형을 개발하고자 한다. 또한 시나리오를 가정하여 범죄발생 확률을 지도로 시각화함으로써 사용자의 이해도를 높이도록 하였다. 선행 연구 및 사례에서 범죄발생에 영향을 미치는 요인 중 빅데이터로 구축 가능한 범죄정보, 날씨정보(기온, 강수량, 풍속, 습도, 일조, 일사, 적설, 전운량), 지역정보(평균 건폐율, 평균 용적율, 평균 높이, 총 건축물수, 평균 공시지가, 평균 주거용도면적, 평균 지상층수)를 머신러닝에 활용할 수 있도록 데이터를 사전 처리하였다. 머신러닝 알고리즘으로서 지도학습 모형 중 다양한 분야에서 활용되며 정확도가 높다고 알려진 의사결정나무모형, 랜덤포레스트모형, Support Vector Machine(SVM)모형을 활용하여 범죄 예측 모형을 구축하고 비교 분석하였다. 그 결과 평균 제곱근 오차(Root Mean Square Error, RMSE)가 낮아 예측력이 높은 의사결정나무모형을 최적모형으로 선정하였다. 이를 바탕으로 가장 빈번하게 발생하는 절도와 폭력범죄를 대상으로 시나리오를 작성하여 범죄 발생 위험지역을 예측한 결과, 사례도시 J시는 위험지역이 3가지 패턴으로 발생하는 것으로 나타났으며, 각각 발생확률을 3 등급으로 구분하여 $250{\times}250m$ 단위의 지도형태로 시각화할 수 있었다. 본 연구는 향후 자동화 시스템으로 개발하여 시시각각으로 변하는 도시 상황에 따라 실시간으로 예측 결과를 시각화하여 제공함으로써 보다 범죄로부터 안전한 도시환경 조성에 기여하고자 한다.

Abstract AI-Helper 아이콘AI-Helper

In Korea, citizens can only know general information about crime. Thus it is difficult to know how much they are exposed to crime. If the police can predict the crime risky area, it will be possible to cope with the crime efficiently even though insufficient police and enforcement resources. However...

주제어

표/그림 (10)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 구축된 모형을 활용하여 범죄 발생 위험지역을 예측하고 이를 지도에 시각화하여 표현하면 사용자가 이해하기 쉬울 것이다. 또한 조건의 변화(예를 들면 날씨나 시간대의 변화)에 따라 즉각적으로 예측결과를 시각화하여 주는 자동화 시스템이 필요하지만, 본 연구는 아직 이 단계에 도달하지 못해, 다음과 같이 시나리오를 가정하여 각 시나리오에 따른 범죄발생 위험지역을 예측하고, 이를 시각화하는 방법으로 진행하고자 한다. 범죄유형은 그림 3과 같이 대상지역에서 2년 동안 절도 2,710건, 폭력 2,081건으로 강간·추행, 강도, 살인에 비하여 현저하게 많이 발생하고 있기 때문에 절도와 폭력으로 하였다.
  • 또한 해외의 다양한 시스템 사례연구를 토대로 한국의 실정에 맞는 연구의 방법 및 데이터를 구축하고자 하였다. 먼저 해외 범죄 관련 정보를 제공하는 시스템 및 웹사이트는 범죄 발생 현황을 제공하는 것과 범죄 발생 위험지역을 예측하여 제공하는 것으로 나뉜다.
  • 범죄는 그 지역의 사회경제적, 인구학적, 물리적, 환경적 특성들에 영향을 받기 때문에 무작위로 발생하는 것이 아니라 상황에 따라 집중과 반복하여 발생하는 패턴이 있다(Newburnet al, 2004). 본 연구에서는 실험적으로 우리나라에서 사례지역의 환경적 특성이 반영된 빅데이터를 구축하고, 머신러닝 기반으로 범죄발생 위험지역 예측 모형을 탐색하고자 한다.
  • 본 연구에서는 주어진 범죄자료와 도시정보를 바탕으로 학습하여 범죄를 예측하는 연구이므로 연구의 목적에 따라 지도학습으로 모형개발을 진행하도록 하며, 이와 관련한 선행연구를 검토하였다. 지도학습에 속하는 머신러닝 알고리즘으로는 나이브 베이즈(Naive Bayesian)모형, 로지스틱 회귀모형, 의사결정나무(Decision Tree)모형, 랜덤포레스트(Random Forest)모형, 신경망 모형, 서포트벡터머신(Support Vector Machine, SVM)모형 등이 있지만 본 연구에서는 예측 및 분류연구에 주로 사용되며 그 정확도가 다른 모형들에 비하여 높다고 선행연구에서 알려진 의사결정나무, 랜덤포레스트, SVM 모형을 중심으로 연구대상지에 적용하여, 범죄발생 위험지역을 가장 정확하게 예측하는 모형을 탐색해 보고자 한다.
  • 이에 본 연구는 범죄예측부터 결과의 시각화까지 자동화된 시스템을 개발하는 전 단계로 우선 빅데이터로 구축 가능한 도시 및 범죄 관련 정보를 구축하고, 머신러닝 기반 범죄발생 위험지역 예측 모형을 탐색 한 후, 시나리오 별로 범죄를 예측하여 그 결과를 지도로 시각화하는 과정을 제시하고 구현하는 것을 목적으로 한다.
  • 이에 본 연구에서는 지역 내 범죄 발생 데이터와 범죄발생과는 직접적인 연관성이 있지만 그동안 기술부족으로 고려되지 않았던 범죄 연관 정보를 활용하여 빅데이터를 활용한 머신러닝 기법으로 범죄발생 위험지역 예측모형을 구축하고 검증해 보았다.
  • 본 연구에서는 주어진 범죄자료와 도시정보를 바탕으로 학습하여 범죄를 예측하는 연구이므로 연구의 목적에 따라 지도학습으로 모형개발을 진행하도록 하며, 이와 관련한 선행연구를 검토하였다. 지도학습에 속하는 머신러닝 알고리즘으로는 나이브 베이즈(Naive Bayesian)모형, 로지스틱 회귀모형, 의사결정나무(Decision Tree)모형, 랜덤포레스트(Random Forest)모형, 신경망 모형, 서포트벡터머신(Support Vector Machine, SVM)모형 등이 있지만 본 연구에서는 예측 및 분류연구에 주로 사용되며 그 정확도가 다른 모형들에 비하여 높다고 선행연구에서 알려진 의사결정나무, 랜덤포레스트, SVM 모형을 중심으로 연구대상지에 적용하여, 범죄발생 위험지역을 가장 정확하게 예측하는 모형을 탐색해 보고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
우리 일상생활에도 변화를 가져온 머신러닝의 예는? 머신러닝은 여러 분야에 매우 광범위하게 전개되고 있으며, 광고, 번역, 스팸차단, 게임, 음성 및 문자인식, 텍스트마이닝과 같은 검색엔진은 물론, 지능형 로봇, 자율주행 자동차와 같은 산업분야에서 이미 상용화되고 있다. 우리 일상생활에도 변화를 가져오고 있는데, 예를 들면 음악감상이나 라디오 청취를 위해 사용하던 스피커가 소리를 전달하는 단순한 도구에서 인공지능, 음성인식 기술 등을 활용한 AI 스피커로 발전하여 대중화되고 있다. 이뿐 아니라 글로벌 기업인 아마 존은 클라우드 기반 머신러닝 기술을 이용해 야구 경기 심층 분석, 예측 등을 제공하기로 메이저리그(MLB)와 계약했고, 한국의 한 카드회사는 올해 하반기 중 머신러닝 기반 사고예측 모형을 통한 이상금융거래탐지시스템(Fraud Detection System, FDS)을 고도화할 예정이다.
지역정보에 포함되는 것은? 또한 시나리오를 가정하여 범죄발생 확률을 지도로 시각화함으로써 사용자의 이해도를 높이도록 하였다. 선행 연구 및 사례에서 범죄발생에 영향을 미치는 요인 중 빅데이터로 구축 가능한 범죄정보, 날씨정보(기온, 강수량, 풍속, 습도, 일조, 일사, 적설, 전운량), 지역정보(평균 건폐율, 평균 용적율, 평균 높이, 총 건축물수, 평균 공시지가, 평균 주거용도면적, 평균 지상층수)를 머신러닝에 활용할 수 있도록 데이터를 사전 처리하였다. 머신러닝 알고리즘으로서 지도학습 모형 중 다양한 분야에서 활용되며 정확도가 높다고 알려진 의사결정나무모형, 랜덤포레스트모형, Support Vector Machine(SVM)모형을 활용하여 범죄 예측 모형을 구축하고 비교 분석하였다.
머신러닝이 상용화되고 있는 부분은? 알파고를 계기로 인공지능(Artificial Intelligence, AI)에 대한 관심이 증가하고 있고, 핵심 기술인 머신러닝(machine learning)과 딥러닝(deep learning)에 대한 연구도 확대되고 있다. 머신러닝은 여러 분야에 매우 광범위하게 전개되고 있으며, 광고, 번역, 스팸차단, 게임, 음성 및 문자인식, 텍스트마이닝과 같은 검색엔진은 물론, 지능형 로봇, 자율주행 자동차와 같은 산업분야에서 이미 상용화되고 있다. 우리 일상생활에도 변화를 가져오고 있는데, 예를 들면 음악감상이나 라디오 청취를 위해 사용하던 스피커가 소리를 전달하는 단순한 도구에서 인공지능, 음성인식 기술 등을 활용한 AI 스피커로 발전하여 대중화되고 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (31)

  1. Almanie, T., R. Mirza and E. Lor. 2015. Crime prediction based on crime types and using spatial and temporal criminal hotspots. International Journal of Data Mining & Knowledge Management Process 5(4):1-19. 

  2. Ahn, H.C. 2014. Optimization of multiclass support vector machine using genetic algorithm : application to the prediction of corporate credit rating. Information Systems Review 16(3):161-177. 

  3. Bae, S.W. and J.S. Yu. 2018. Predicting the real estate price index using machine learning methods and time series analysis model. Housing Studies 26:107-133. 

  4. Brown, I. and C. Mues. 2012. An experimental comparison of classification algorithms for imbalanced credit scoring data sets. Expert Systems with Applications 39(3):3446-3453. 

  5. Chaurasia, V. and S. Pal. 2013. Early prediction of heart diseases using data mining techniques. Caribbean Journal of Science and Technology 1:208-217. 

  6. Cho, Y.R., Kim, Y.C. and Y.S. Shin. 2017. Prediction model of construction safety accidents using decision tree technique. Journal of the Korea Institute of Building Construction 17(3):295-303. 

  7. Choi, H.N. and D.H. Lim. Bankruptcy prediction using ensemble SVM model. Journal of the Korean Data & Information Science Society 24(6):1113-1125. 

  8. Choi, J.H. and D.S. Seo. 1999. Decision trees and its applications. Statistical Analysis Studies 4(1):61-83 

  9. Cortes, C. and V. Vapnik. 1995. Supportvector networks. Machine learning 20(3):273-297. 

  10. Elleng G. and COHN. 1990. Weather and crime. The British Journal of Criminology 30(1):51-64. 

  11. Guo, F., L. Zhang., S. Jin., M. Tigabu., Z. Su and W. Wang. 2016. Modeling anthropogenic fire occurrence in the boreal forest of China using logistic regression and random forests. Forests 7(11):250. 

  12. Hajek, P. and K. Michalak. 2013. Feature selection in corporate credit rating prediction. Knowledge-Based Systems 51:72-84. 

  13. Heo, J.Y. and J.Y. Yang. 2015. SVM based stock price forecasting using financial statements. KIISE Transactions on Computing Practices (KTCP) 21(2):167- 172. 

  14. Heo, S.Y., J.Y. Kim and T.H. Moon. 2017. Crime incident prediction model based on Bayesian probability. Journal of the Korean Association of Geographic Information Studies 20(4):89-101. 

  15. Horrocks, J. and A.K. Menclova. 2011. The effects of weather on crime, New Zealand Economic Papers 45(3):231-254. 

  16. Jeong, J.H., J.H. Kim., J.H. Choo., S.H. Lee. and C.T. Hyun. 2017. Common maintenance cost estimation model using random forest for multi-family housing. Journal of the Architectural Institute of Korea 33(3):19-27. 

  17. Kim, S.J. and H.C. Ahn. 2016. Application of random forests to corporate credit rating prediction. Industrial Innovation Studies 32(1):187-211. 

  18. Kim, S.J. and B.Y. Kim. 2013. Comparative analysis of predictors of depression for residents in a metropolitan city using logistic regression and decision making tree. Journal of The Korea Institute of Building Construction 13(12):829-839. 

  19. Lee, S.K. and T.S. Shin. 2018. Development and application of prediction model of hyperlipidemia using SVM and metalearning algorithm. Journal of Intelligence and Information Systems 24(2):111-124. 

  20. Lee, S. M. 2017. Spatial analysis of flood and landslide susceptibility in Seoul using random forest and boosted tree models. Master. Thesis, Univ. of Seoul, Seoul, Korea. 78pp. 

  21. Neuilly, M.A., K.M. Zgoba., G.E. Tita and S.S. Lee. 2011. Predicting recidivism in homicide offenders using classification tree analysis. Homicide studies 15(2): 154-176. 

  22. Newburn, T. and R. Sparks.(eds.). 2004. Criminal Justice and Political Cultures: National and international dimensions of crime control. Willan Publishing. UK. 

  23. Oh, B.H., K.W. Chung. and K.S. Hong. 2015. Gaze recognition system using random forests in vehicular environment based on smart-phone. The Journal of The Institute of Internet. Broadcasting and Communication 15(1):191-197. 

  24. Oliveira, S., F. Oehler., J. San-Miguel-Ayanz., A. Camia and J.M. Pereira. 2012. Modeling spatial patterns of fire occurrence in Mediterranean Europe using Multiple Regression and Random Forest. Forest Ecology and Management 275:117-129. 

  25. Park, W.K. and S.Y. Kim. 2003. A Study on TV program rating prediction : Emphasizing the comparison of prediction capability between regression model and data mining model. Advertising Research 58:61-79. 

  26. Ranson, M. 2014. Crime, weather, and climate change. Journal of Environmental Economics and Management 67(3):274-302. 

  27. Song, J.Y. and T.M. Song. 2018. Crime prediction using Big Data. Hwangsogeoleum academi. Seoul. 414pp. 

  28. Song, Y.S., Y.C. Cho., Y.S. Seo and S.R. Ahn. 2009. Development and its application of computer program for slope hazards prediction using Decision Tree Model. Journal of The Korean Society of Civil Engineers 29(2):59-69. 

  29. Wikipedia. https://www.wikipedia.org/. 

  30. Yoo, B.K., K.Y. Choi and D.K. Kim. 2018. An study on shopper's retail format choice via Machine Learning Method : Based on national chain market and traditional market. The Journal of Business Education 32(1):155-174. 

  31. Yoo, J.E. 2015. Random forests, an alternative data mining technique to decision tree. Journal of Educational Evaluation 28(2):427-448. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로