고급 GIS 및 복잡한 공간 분석 기술이 발전함에 따라 다양한 의사 결정 지원 시스템에서 지리적 혹은 공간적 문제 해결을 위한 고급 지식을 지원하기 위해 더욱 강력한 기술이 필요하게 되었다. 또한, 법집행 기관 및 수사 기관 등을 중심으로 효율적인 수사 및 향후 범죄 예방을 위해 과학 수사, 법 과학에 관한 연구의 필요성이 증대되고 있다. 특히, 연쇄 범죄의 공간적 패턴을 분석함으로써 범죄자의 거점 위치를 예측하기 위한 지리적 프로파일링(Geographic Profiling)에 대한 연구가 활발하다. 그러나, 기존의 지리적 프로파일링 연구에서는 공간적 패턴 분석을 위해 단순히 통계적 방법만을 사용하고 있고, 연쇄 범죄에 대한 다양한 공간적, 시간적 분석 기술을 지원하지 않으므로 거점 예측시 낮은 정확도를 보인다. 그러므로, 본 논문에서는 범행 위치의 공간적 분포와 범죄 발생의 시간적 분포 특성에 따라 연쇄 범죄의 시공간 패턴을 유형화하고, 이를 기반으로 연쇄 범죄의 거점 위치를 보다 정확하게 예측하는 알고리즘으로 STA-BLP(Spatio-Temporal Analysis based Base LocationPrediction)을 제안한다. STA-BLP는 하나의 거점으로부터 특정 방향을 선호하여 이동하며 발생되는 연쇄 범죄의 비등방성 패턴을 고려하고, 동일한 경로에 대한 반복 이동에 대한 범죄자의 학습 효과를 고려함으로써 예측 정확도를 개선시킨다. 또한, 다수의 군집화된 범행 위치들로부터 각 군집에 소속된 범행 위치들에 대한 지역적 거점 위치 예측과 모든 범행 위치에 대한 전역적 거점 위치 예측을 통해 거점이 다수 존재하는 연쇄 범죄의 경우에도 보다 정확한 예측을 수행한다. 마지막으로 다양한 실험을 통해 기존에 제시된 알고리즘과 STA-BLP의 예측 정확도를 비교하여 제안 알고리즘의 우수성을 입증하였다.
고급 GIS 및 복잡한 공간 분석 기술이 발전함에 따라 다양한 의사 결정 지원 시스템에서 지리적 혹은 공간적 문제 해결을 위한 고급 지식을 지원하기 위해 더욱 강력한 기술이 필요하게 되었다. 또한, 법집행 기관 및 수사 기관 등을 중심으로 효율적인 수사 및 향후 범죄 예방을 위해 과학 수사, 법 과학에 관한 연구의 필요성이 증대되고 있다. 특히, 연쇄 범죄의 공간적 패턴을 분석함으로써 범죄자의 거점 위치를 예측하기 위한 지리적 프로파일링(Geographic Profiling)에 대한 연구가 활발하다. 그러나, 기존의 지리적 프로파일링 연구에서는 공간적 패턴 분석을 위해 단순히 통계적 방법만을 사용하고 있고, 연쇄 범죄에 대한 다양한 공간적, 시간적 분석 기술을 지원하지 않으므로 거점 예측시 낮은 정확도를 보인다. 그러므로, 본 논문에서는 범행 위치의 공간적 분포와 범죄 발생의 시간적 분포 특성에 따라 연쇄 범죄의 시공간 패턴을 유형화하고, 이를 기반으로 연쇄 범죄의 거점 위치를 보다 정확하게 예측하는 알고리즘으로 STA-BLP(Spatio-Temporal Analysis based Base Location Prediction)을 제안한다. STA-BLP는 하나의 거점으로부터 특정 방향을 선호하여 이동하며 발생되는 연쇄 범죄의 비등방성 패턴을 고려하고, 동일한 경로에 대한 반복 이동에 대한 범죄자의 학습 효과를 고려함으로써 예측 정확도를 개선시킨다. 또한, 다수의 군집화된 범행 위치들로부터 각 군집에 소속된 범행 위치들에 대한 지역적 거점 위치 예측과 모든 범행 위치에 대한 전역적 거점 위치 예측을 통해 거점이 다수 존재하는 연쇄 범죄의 경우에도 보다 정확한 예측을 수행한다. 마지막으로 다양한 실험을 통해 기존에 제시된 알고리즘과 STA-BLP의 예측 정확도를 비교하여 제안 알고리즘의 우수성을 입증하였다.
With the recent development of advanced GIS and complex spatial analysis technologies, the more sophisticated technologies are being required to support the advanced knowledge for solving geographical or spatial problems in various decision support systems. In addition, necessity for research on sci...
With the recent development of advanced GIS and complex spatial analysis technologies, the more sophisticated technologies are being required to support the advanced knowledge for solving geographical or spatial problems in various decision support systems. In addition, necessity for research on scientific crime investigation and forensic science is increasing particularly at law enforcement agencies and investigation institutions for efficient investigation and the prevention of crimes. There are active researches on geographic profiling to predict the base location such as criminals' residence by analyzing the spatial patterns of serial crimes. However, as previous researches on geographic profiling use simply statistical methods for spatial pattern analysis and do not apply a variety of spatial and temporal analysis technologies on serial crimes, they have the low prediction accuracy. Therefore, this paper identifies the typology the spatio-temporal patterns of serial crimes according to spatial distribution of crime sites and temporal distribution on occurrence of crimes and proposes STA-BLP(Spatio-Temporal Analysis based Base Location Prediction) algorithm which predicts the base location of serial crimes more accurately based on the patterns. STA-BLP improves the prediction accuracy by considering of the anisotropic pattern of serial crimes committed by criminals who prefer specific directions on a crime trip and the learning effect of criminals through repeated movement along the same route. In addition, it can predict base location more accurately in the serial crimes from multiple bases with the local prediction for some crime sites included in a cluster and the global prediction for all crime sites. Through a variety of experiments, we proved the superiority of the STA-BLP by comparing it with previous algorithms in terms of prediction accuracy.
With the recent development of advanced GIS and complex spatial analysis technologies, the more sophisticated technologies are being required to support the advanced knowledge for solving geographical or spatial problems in various decision support systems. In addition, necessity for research on scientific crime investigation and forensic science is increasing particularly at law enforcement agencies and investigation institutions for efficient investigation and the prevention of crimes. There are active researches on geographic profiling to predict the base location such as criminals' residence by analyzing the spatial patterns of serial crimes. However, as previous researches on geographic profiling use simply statistical methods for spatial pattern analysis and do not apply a variety of spatial and temporal analysis technologies on serial crimes, they have the low prediction accuracy. Therefore, this paper identifies the typology the spatio-temporal patterns of serial crimes according to spatial distribution of crime sites and temporal distribution on occurrence of crimes and proposes STA-BLP(Spatio-Temporal Analysis based Base Location Prediction) algorithm which predicts the base location of serial crimes more accurately based on the patterns. STA-BLP improves the prediction accuracy by considering of the anisotropic pattern of serial crimes committed by criminals who prefer specific directions on a crime trip and the learning effect of criminals through repeated movement along the same route. In addition, it can predict base location more accurately in the serial crimes from multiple bases with the local prediction for some crime sites included in a cluster and the global prediction for all crime sites. Through a variety of experiments, we proved the superiority of the STA-BLP by comparing it with previous algorithms in terms of prediction accuracy.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이때 지역적 거점 위치 예측은 앞 절에서 언급한 단일 중심점 패턴 연쇄 범죄의 거점 위치 예측 알고리즘을 각 활성 군집에 소속된 범행 위치들에 대하여 적용함으로써 수행된다. 또한, 전역적 거점 위치 예측은 군집 내 범행들의 발생 빈도, 범행 발생 시간의 최근 여부를 고려함으로써 수행된다. 예를 들어, 범죄자가 상대적으로 빈번히 범행을 수행했던 군집 혹은 상대적으로 최근 범행을 수행했던 군집은 다른 군집에 비하여 거점으로부터의 이동이용이할 수 있으므로 전역적 거점 위치 예측을 위해 높은 거점 가중치가 부여된다.
중심점이란 등방성 패턴인 연쇄 범죄의 경우 범행 위치까지의 이동을 위한 공간적 중심인 한 점(Point)을 의미한다. 본 논문에서 제안하는 거점 위치 예측 알고리즘에서는 등방성 패턴의 연쇄 범죄 범행 위치들로부터 이러한 중심점을 찾는다. 즉, 등방성 패턴의 연쇄 범죄에서는 중심점이곧 거점이 된다.
본 논문에서는 다중 중심점 패턴의 연쇄 범죄에 대한 거점 위치 예측을 위해서 군집 단위의 지역적 거점 위치 예측 기법과 모든 범행 위치에 대하여 군집화 특성에 따라 결정되는 전역적 거점 위치 예측 기법을 제시한다. 이를 통해 각 거점이 각 활성군집의 중심 역할을 하는 경우와 한 거점이 모든 다수의 활성 군집의 중심 역할을 하는 경우를 모두 고려할 수 있다.
본 논문에서는 다중 중심축 패턴의 연쇄 범죄에 대한 범죄자 거점 위치 예측을 위해서 군집 단위의 지역적 거점 위치 예측 기법과 모든 범행 위치에 대하여 군집화 특성에 따라 결정하는 전역적 거점 위치 예측 기법을 제시한다. 따라서, 다중 중심축 패턴 연쇄 범죄의 거점 예측은 각 거점이 각 군집의 중심 역할을 하는 경우와 한 거점이 모든 다수의 활성 군집의 중심 역할을 하는 경우 모두 적용이 가능하다.
본 논문에서는 단일 중심축 패턴의 연쇄 범죄에 대한 거점 위치 예측을 위해서 범행의 중심축으로써 연속적인 범행 위치들을 연결하는 초기 이동선 (MovingLine)을 생성한다. 이동선을 기반으로 범죄자가 동일한 방향 및 동일한 경로로 이동한 경우 범행을 위한 비용을 이동선 진입 비용, 이동선상 이동 비용, 이동선에서 범행 위치까지의 이동 비용의총합으로 정의하고 이러한 비용이 최소가 되는 지점을 CMC(Center of Minimum Cost)라 한다.
본 논문은 시공간 분석 기반 연쇄 범죄 거점 위치 예측 알고리즘의 실험 평가를 위해서 두가지 평가 지표를 정의한다. 첫 번째로, ErrorDistanceTopPoint는 한 점 혹은 다수 점으로 표현되는 예측 거점 위치와 실제 거점 위치와의 최소 거리로써 예측 결과에 대한 정량적 오차 분석을 위해 사용된다.
이러한 문제점을 해결하기 위해 본 논문에서는 범죄 발생 장소에 대한 공간적 분포와 범죄 발생 시각에 대한 시간적 분포 특성에 따라 연쇄 범죄의 시공간 패턴을 유형화하고, 연쇄 범죄의 거점 위치를 보다 정확하고 효율적으로 예측하는 시공간 분석 기반 연쇄 범죄 위치 예측 알고리즘을 제안하였다. 본 논문에서 제시한 시공간 분석 기반 연쇄 범죄 거점 위치 예측 알고리즘의 특징은 다음과 같다.
가설 설정
1) 두 개 이상의 거점으로부터 연쇄 범죄의 범행들이 수행될 수 있다.
1) 모든 범행 위치들을 포함하는 1개 군집 Ca는 활성 군집이다.
가정1) 범인은 연쇄 범죄를 수행하는 동안 하나의 거점에서 이동하지 않는다. 가정2) 거점으로부터 모든 방향이 범행에 대한 동일한 기회를 갖는다.
가정1은 연쇄 범죄로 연관된 모든 범행들이 하나의 거점으로부터 발생되었다는 것을 의미한다. 따라서, 집, 회사, 부모님의 집, 친구의 집 등 범죄자의 일상 생활에서 실제 근거지가 다수일 때 거점 예측의 한계를 보인다.
범인은 연쇄 범죄를 수행하는 동안 하나의 거점에서 이동하지 않는다. 가정2) 거점으로부터 모든 방향이 범행에 대한 동일한 기회를 갖는다.
따라서, 집, 회사, 부모님의 집, 친구의 집 등 범죄자의 일상 생활에서 실제 근거지가 다수일 때 거점 예측의 한계를 보인다. 가정2는 범죄자가 범행 위치를 선택할 때 거점을 중심으로 모든 방향이 같은 확률을 가진다는 것을 의미한다. 따라서, 지리적 ·지형적 특성 등으로 인해 특정한 방향성을 갖는 연쇄 범죄에 대해 거점 예측의 한계를 보인다.
제안 방법
그림 14는 기존의 지리적 프로파일링 알고리즘인 Criminal Geographic Targeting(CGT), Canter Model(CM), Journey-to-Crime(JTC), CMD와 STA-BLP 알고리즘의 평균 ErrorDistanceTopPoint 및 평균 ErrorDistance-TopArea를 비교한 것을 보여준다. Criminal Geographic Targeting, Canter Model, Journey-to-Crime 에서는 거리 감퇴 함수의 입력 파라미터들에 대해 기본값을 적용하였고, STA-BLP에서는 중앙점 조정 비율 0.4, 동일 경로 학습률 0.4를 적용하였다. 평균 ErrorDistance-TopArea 값을 기준으로 STA-BLP은 Canter Model 및 Journeyto-Crime에 비해 5배 정도 높은 정확도를 보이며, Criminal Geographic Targeting에 비해 9배 이상 높은 정확도를 보인다.
그러므로 본 논문에서는 보다 높은 정확도를 갖는 연쇄 범죄 위치 예측을 위해 범죄 발생 장소에 대한 공간적 분포와 범죄 발생 시각에 대한 시간적 분포 특성에 따라 연쇄 범죄의 시공간 패턴을 유형화하였다. 또한 본 논문에서는 보다 정확한 예측을 위해 특정 방향을 선호하여 이동하면서 발생되는 비등방성 패턴의 연쇄 범죄를 고려하였고, 다수 거점이 존재하는 패턴의 연쇄 범죄도 고려하였다.
그러므로 본 논문에서는 보다 높은 정확도를 갖는 연쇄 범죄 위치 예측을 위해 범죄 발생 장소에 대한 공간적 분포와 범죄 발생 시각에 대한 시간적 분포 특성에 따라 연쇄 범죄의 시공간 패턴을 유형화하였다. 또한 본 논문에서는 보다 정확한 예측을 위해 특정 방향을 선호하여 이동하면서 발생되는 비등방성 패턴의 연쇄 범죄를 고려하였고, 다수 거점이 존재하는 패턴의 연쇄 범죄도 고려하였다. 특히, 비등방성 패턴의 연쇄 범죄의 경우 동일한 경로에 대한 반복 이동에 대한 범죄자의 학습 효과를 적용하였고, 다수 거점에 의한 연쇄 범죄의 경우 다수의 군집화된 범행 위치들로부터 각 군집에 소속된 범행 위치들에 대한 지역적 거점 위치 예측과 모든 범행 위치에 대한 전역적 거점 위치 예측을 수행함으로써 연쇄 범죄 거점 예측의 정확도를 개선하였다.
먼저, 단일 중심축 패턴 연쇄 범죄와 다중 중심축 패턴 연쇄 범죄의 경우 예측 결과에 큰 영향을 끼치게 되는 이동선의 중앙점 조정 비율과 범죄자의 동일 경로 학습률에 따라 거점 위치 예측 오차를 분석함으로써 STA-BLP 알고리즘의 예측 정확도를 확인한다. 또한, 다양한 시공간 패턴을 보이는 연쇄 범죄 데이터에 대한 실험을 통하여 기존에 제시된 알고리즘들과 STA-BLP 알고리즘에 따른 거점 위치 예측 오차를 분석함으로써 알고리즘 간의 예측 정확도를 비교한다.
본 장에서는 실험에서 사용된 연쇄 범죄 데이터와 평가 지표에 대하여 언급하고, 다양한 실험을 통하여 기존에 제시된 알고리즘들과 본 논문에서 제시한 알고리즘의 정확도를 비교 설명한다. 먼저, 단일 중심축 패턴 연쇄 범죄와 다중 중심축 패턴 연쇄 범죄의 경우 예측 결과에 큰 영향을 끼치게 되는 이동선의 중앙점 조정 비율과 범죄자의 동일 경로 학습률에 따라 거점 위치 예측 오차를 분석함으로써 STA-BLP 알고리즘의 예측 정확도를 확인한다. 또한, 다양한 시공간 패턴을 보이는 연쇄 범죄 데이터에 대한 실험을 통하여 기존에 제시된 알고리즘들과 STA-BLP 알고리즘에 따른 거점 위치 예측 오차를 분석함으로써 알고리즘 간의 예측 정확도를 비교한다.
즉, 검색 영역내의 모든 셀들은 CMD인지를 판단하기 위한 후보 CMD가 된다. 모든 범행 위치들로부터 공간상 가장 가까운 하나의 CMD를 찾기 위하여 각 후보 CMD에 대하여 모든 범행 위치들에 대한 거리합을 구한다.
본 논문에서 실험은 6번 이상 범행을 저지른 16건의 연쇄 범죄 데이터를 이용하여 실제 거점 위치에 대한 예측 정확도를 비교하였다. 실험에 사용된 연쇄 범죄 데이터는 살인, 강간, 강도 등 다양한 유형의 범죄 데이터이며 따라서 다양한 공간적 분포 특성을 갖는다.
중심축이란 비등방성 패턴인 연쇄 범죄의 경우 범행 위치까지의 이동을 위한 공간적 중심인 선(Line)을 의미한다. 본 논문에서 제안 하는 거점 위치 예측 알고리즘에서는 비등방성 패턴의 연쇄 범죄 범행 위치들로부터 중심축을 찾고그 중심축상의 반복적인 이동을 고려하여 최소 비용 지점을 거점으로 찾는다. 즉, 비등방성 패턴의 연쇄 범죄에서 중심축은 거점을 찾기 위해 활용된다.
본 논문에서는 우선 STA-BLP 알고리즘에서 사용되는 자료 구조에 대하여 살펴보고, STABLP 알고리즘을 크게 네 부분(단일 중심점 패턴, 다중 중심점 패턴, 단일 중심축 패턴, 다중 중심축 패턴)으로 구분하여 각 패턴의 연쇄 범죄에 대한 거점 예측 기법을 설명한다.
본 장에서는 연쇄 범죄의 시공간 패턴에 따라 보다 정확하게 거점 위치를 예측할 수 있는 시공간 분석 기반 연쇄 범죄 거점 위치 예측 알고리즘인 STA-BLP(Spatio-Temporal Analysis based Base Location Prediction)을 제시한다. 거점 (Base)은 범죄 활동의 근거지를 의미하며 범죄자의 거주지, 회사, 친구 집, 친척 집 등이 예가 될 수 있다.
둘째, 범죄 발생 위치 들을 다수개의 서로 다른 군집들로 분류한 후, 각 군집 내 범행에 대한 지역적 거점 예측과 검색 영역의 모든 범행에 대한 전역적 거점 예측이 가능하다. 셋째, 모든 거점 예측 시 범죄들의 발생 공간뿐만 아니라 발생 시간도 활용하여 예측 정확도를 개선하였다.
이 알고리즘에서는 모든 범행 위치들로부터 이동 선을 생성하고 후보 CMC들을 추출한다. 그리고, 전체 영역의 topRate 비율에 해당하는 최소 비용의 후보 CMC들을 찾아서 거점 영역을 반환한다.
알고리즘의 입력으로는 예측 대상인 범죄 데이터(pts)를 가지고, 출력으로는 예측된 거점 영역(baseArea)을 반환한다. 이 알고리즘에서는 우선 CMD를 찾고, 이 CMD 와 모든 범행 위치들과의 평균 거리를 구한다. 그리고 CMD를 중심점으로 평균 거리를 반지름으로 하는 원 영역을 거점 영역으로 생성한다.
지역적 거점 위치 예측의 경우에는 각 활성 군집에 소속된 범행 위치들에 대하여 단일 중심축 패턴 연쇄 범죄의 거점 위치 예측 알고리즘을 적용한다. 즉, 각 활성 군집에 소속된 범행 위치들로부터 생성된 군집별 이동선을 기반으로 각 후보 CMC에서그 군집내 범행 위치들까지의 총비용을 계산한다. 전역적 거점 위치 예측의 경우에는 모든 활성 군집에 소속된 범행 위치들에 대하여 단일 중심축 패턴 연쇄 범죄의 거점 위치 예측 알고리즘을 적용한다.
전역적 거점 위치 예측의 경우에는 모든 활성 군집에 소속된 범행 위치들에 대하여 단일 중심축 패턴 연쇄 범죄의 거점 위치 예측 알고리즘을 적용한다. 즉, 모든 활성 군집들에 소속된 모든 범행 위치들로부터 생성된 이동선을 기반으로 각 후보 CMC에서 모든 활성 군집내 범행 위치들까지의 총비용을 계산한다.
최소 노력의 원칙에 따라 모든 범행을 수행하기 위해 최소의 비용이 요구되는 지점인 CMD가 거점으로 고려될 수 있으므로 본 논문에서는 단일 중심점 패턴의 연쇄 범죄에 대한 거점 위치 예측을 위해 CMD 방법을 활용하여 중심점을 찾는다. 즉, 모든 범행 위치들로부터 공간상 가장 가까운 한 점을 찾고 그 점과 다른 모든 범행 위치들과의 평균 거리만큼의 반지름을 갖는 원 영역을 생성한다.
또한 본 논문에서는 보다 정확한 예측을 위해 특정 방향을 선호하여 이동하면서 발생되는 비등방성 패턴의 연쇄 범죄를 고려하였고, 다수 거점이 존재하는 패턴의 연쇄 범죄도 고려하였다. 특히, 비등방성 패턴의 연쇄 범죄의 경우 동일한 경로에 대한 반복 이동에 대한 범죄자의 학습 효과를 적용하였고, 다수 거점에 의한 연쇄 범죄의 경우 다수의 군집화된 범행 위치들로부터 각 군집에 소속된 범행 위치들에 대한 지역적 거점 위치 예측과 모든 범행 위치에 대한 전역적 거점 위치 예측을 수행함으로써 연쇄 범죄 거점 예측의 정확도를 개선하였다.
대상 데이터
본 논문에서 실험은 6번 이상 범행을 저지른 16건의 연쇄 범죄 데이터를 이용하여 실제 거점 위치에 대한 예측 정확도를 비교하였다. 실험에 사용된 연쇄 범죄 데이터는 살인, 강간, 강도 등 다양한 유형의 범죄 데이터이며 따라서 다양한 공간적 분포 특성을 갖는다. 각 범행의 발생 시각 및 발생 장소를 포함하는 실험 데이터는 상대 좌표로 먼저 변환되었고, 또한 발생 순서에 따라 순서화되었다.
이론/모형
확률 거리 접근 방법은 범죄자의 거점으로부터 거리가 먼 지역일수록 범죄 발생 수가 줄어든다는 거리 감퇴 모델(Distance Decay Model)을 기반으로 한다. 거점으로부터의 거리와 범죄 발생 수에 관한 정량적 관계에 대한 다양한 수식을 이용하여 검색 영역안의 모든 위치에 대해 거점이 될 확률값을 구하므로 수학적 방법이라고도 한다.
성능/효과
2) Ca에 소속된 범행 위치들 중 최소인 범행번호가 다른 군집 Cb에 소속된 범행 위치들 중 최대인 범행번호보다 큰 경우 군집 Ca는 활성 군집이다.
2) 범죄자는 거점으로부터 특정 방향을 선호하여 범행 위치를 선택할 수 있다.
3) 군집 Ca에 소속된 범행 위치들 중 최소인 범행번호가 다른 군집 Cb에 소속된 범행 위치들 중 최대인 범행번호보다 작고, Ca에 소속된 범행 위치들 중 최대인 범행번호가 다른 군집 Cb에 소속된 범행 위치들 중 최소인 범행번호보다 큰 군집 경우 Ca와 Cb는 모두 활성 군집이다.
첫째, 원형 분포의 연쇄 범죄뿐 아니라 중심축을 따라 나타나는 선형 분포의 연쇄 범죄에서도 정확도 높은 거점 예측이 가능하다. 둘째, 범죄 발생 위치 들을 다수개의 서로 다른 군집들로 분류한 후, 각 군집 내 범행에 대한 지역적 거점 예측과 검색 영역의 모든 범행에 대한 전역적 거점 예측이 가능하다. 셋째, 모든 거점 예측 시 범죄들의 발생 공간뿐만 아니라 발생 시간도 활용하여 예측 정확도를 개선하였다.
마지막으로 제안 알고리즘을 구현하여 다양한 실험을 통해 정확도를 평가함으로써 그 우수성을 입증 하였는데, 거점 위치 예측에 있어서 기존의 연구들에 비하여 평균 6배 정도 높은 정확도를 보였다. 향후에는 GIS에서 일반적으로 다루는 도로, 강 등의 공간 정보를 고려하고 추가적인 속성들의 연계를 통해 예측 정확도를 향상시키는 연구가 필요하다.
)에서 개발되어 RIGEL Analyst에 적용된 Criminal Geographic Targeting(CGT)[15]은 임의의 셀과 범죄 위치간의 맨하탄 거리(Manhattan Distance)를 기본으로 거리 감퇴 함수를 정의하고 있다. 주어진 버퍼 존의 크기에 따라 버퍼 존 내부에 위치한 셀과 버퍼 존 외부에 위치한 셀을 구분하고, 정의된 함수에 따라 버퍼 존 내부에 위치한 셀의 경우 범죄 위치와 멀리 있는 셀일수록 큰 확률값을 가지며, 버퍼 존 외부에 위치한 셀의 경우 범죄 위치와 멀리 있는 셀일수록 작은 확률값을 가진다.
6일 때 가장 작다는 것을 알 수 있다. 즉, 본 실험 데이터에서는 평균적으로 동일 경로에 대한 0.4에서 0.6 사이의 학습률을 가진 범죄자들로 구성되어 있다는 것을 알 수 있다.
본 논문에서 제시한 시공간 분석 기반 연쇄 범죄 거점 위치 예측 알고리즘의 특징은 다음과 같다. 첫째, 원형 분포의 연쇄 범죄뿐 아니라 중심축을 따라 나타나는 선형 분포의 연쇄 범죄에서도 정확도 높은 거점 예측이 가능하다. 둘째, 범죄 발생 위치 들을 다수개의 서로 다른 군집들로 분류한 후, 각 군집 내 범행에 대한 지역적 거점 예측과 검색 영역의 모든 범행에 대한 전역적 거점 예측이 가능하다.
4를 적용하였다. 평균 ErrorDistance-TopArea 값을 기준으로 STA-BLP은 Canter Model 및 Journeyto-Crime에 비해 5배 정도 높은 정확도를 보이며, Criminal Geographic Targeting에 비해 9배 이상 높은 정확도를 보인다. 이는 거점이 범행 발생 위치와 공간상 크게 떨어져 있거나 거점이 범행 발생 위치들의 중앙에 위치하지 않을 경우나 거점이 2개인 경우에도 기존 지리적 프로파일링 방법들은 단순히 거리를 기반으로 모든 범행들의 무게 중심, 즉 분포 상 밀도가 가장 높은 지점을 거점으로써 높은 확률을 주기 때문이다.
후속연구
마지막으로 제안 알고리즘을 구현하여 다양한 실험을 통해 정확도를 평가함으로써 그 우수성을 입증 하였는데, 거점 위치 예측에 있어서 기존의 연구들에 비하여 평균 6배 정도 높은 정확도를 보였다. 향후에는 GIS에서 일반적으로 다루는 도로, 강 등의 공간 정보를 고려하고 추가적인 속성들의 연계를 통해 예측 정확도를 향상시키는 연구가 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
공간 분포 접근 방법은 어떠한 방법이라고도 하는가?
공간 분포 접근 방법은 Centrographic 방법이라고도 하며, 거점으로써 모든 범죄 발생 위치들에 대한 평균 위치인 중앙점(Centroid)을 찾는 방법, 모든 범죄 발생 위치들 중 중간점(Median)을 찾는 방법, 모든 범죄 발생 위치들과의 거리합이 가장 작은 위치 CMD(Center Of Minimum Distance)를 찾는 방법 등이 있다. 중앙점은 범행 위치들의 x 좌표값에 대한 산술적 평균을 x 좌표로 하고, 범행 위치들의 y 좌표값에 대한 산술적 평균을 y 좌표로 하는 위치이다.
기존의 지리적 프로파일링 알고리즘은 어떠한 접근방법으로 나뉘는가?
기존의 지리적 프로파일링 알고리즘은 크게 두가지 접근 방법으로 나눠진다. 첫 번째는 범죄 발생 위치들로부터 지리적인 중심 위치를 찾는 공간 분포(Spatial Distribution) 접근 방법이고, 두 번째는 영역안의 모든 위치에서 범죄 발생 위치와의 거리에 따른 확률을 계산하여 거점이 존재할 확률값을 구하는 확률 거리(Probability Distance) 접근 방법이다[16].
공간 분포 접근 방법으로 무엇들이 있는가?
공간 분포 접근 방법은 Centrographic 방법이라고도 하며, 거점으로써 모든 범죄 발생 위치들에 대한 평균 위치인 중앙점(Centroid)을 찾는 방법, 모든 범죄 발생 위치들 중 중간점(Median)을 찾는 방법, 모든 범죄 발생 위치들과의 거리합이 가장 작은 위치 CMD(Center Of Minimum Distance)를 찾는 방법 등이 있다. 중앙점은 범행 위치들의 x 좌표값에 대한 산술적 평균을 x 좌표로 하고, 범행 위치들의 y 좌표값에 대한 산술적 평균을 y 좌표로 하는 위치이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.