$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

데이터 마이닝의 범죄수사 적용 가능성
Usefulness of Data Mining in Criminal Investigation 원문보기

대한수사과학회지 = Journal of Forensic and Investigative Science, v.1 no.2, 2006년, pp.5 - 19  

김준우 (경찰청 수사과) ,  손중권 (경북대학교 자연과학대학 통계학과) ,  이상한 (경북대학교 의과대학 법의학교실)

초록
AI-Helper 아이콘AI-Helper

데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

Abstract AI-Helper 아이콘AI-Helper

Data mining is an information extraction activity to discover hidden facts contained in databases. Using a combination of machine learning, statistical analysis, modeling techniques and database technology, data mining finds patterns and subtle relationships in data and infers rules that allow the p...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 지금까지 데이터 마이닝의 개념과 그 과정에 대해 살펴보았다. 그렇다면 이러한 데이터 마이닝을 통해 우리는 어떤 의미와 패턴을 찾을 수 있는지 살펴보도록 한다.
  • 데이터 마이닝의 수사 적용 가능성에 대해 본 연구에서는 크게 두 가지 방법으로 접근하고자 한다. 우선, 데이터 마이닝에 대한 개념과 기능을 정리하고, 이의 적용과정을 파악하기 위해 문헌 연구를 실시하였다.
  • 이는 데이터 마이닝을 넓은 개념으로 파악하는 것이다. 따라서 본 논문에서는 위 몬트리얼 학술대회에서 밝힌 바와 같이 데이터 마이닝을 지식탐사단계 중 패턴 및 지식 추출을 위한 탐사단계로서의 좁은 의미로 파악하도록 한다.
  • 본 연구는 각 사건마다 접하는 데이터의 종류가 다양해지고, 그 양이 많아지고 있는 상황에서 이를 분석하는 새로운 방법론이 필요하다는 인식하에 최근 데이터 처리의 대안으로 대두되고 있는 데이터 마이닝의 수사 적용 가능성에 대해 고찰하고자 한다. 구체적으로 본 연구에서 다루고자 하는 문제는 다음과 같다.
  • 시각화 작업은 독단적 기법으로 활용되기보다 KDD 마지막 단계에서 예측 결과나 각 기법 적용과정의 이해를 높이는데 많이 사용되므로 통상 데이터 마이닝의 기법에 시각화 기법을 생략하는 경우도 많으나 후술할 데이터 마이닝 수사 적용에 있어 범죄 조직간 관계 파악에 유용하게 활용되므로 본 논문에서는 시각화기법을 따로 들어 설명하도록 한다.
  • 데이터 마이닝의 수사 적용 가능성에 대해 본 연구에서는 크게 두 가지 방법으로 접근하고자 한다. 우선, 데이터 마이닝에 대한 개념과 기능을 정리하고, 이의 적용과정을 파악하기 위해 문헌 연구를 실시하였다. 다양한 학문적 접근 방법인 데이터 마이닝의 정의와 절차를 검토하고, 그 목적과 구체적인 기법을 살펴봄으로써 실제 수사에 적용 가능한 방법론을 모색하였으며, 외국 선행 연구 및 적용사례를 소개하였다.
  • 또한 어느 한 기법들이 독자적으로 사용되는 것은 아니고 데이터 마이닝을 하는데 있어 복합적으로 사용될 수 있다(data mining hybrid technique). 이에 본 논문에서는 가장 많이 사용되는 대표적인 기법들을 소개하고 이의 적용 예를 살펴보도록 한다.
  • 연관성 분석은 주어진 데이터의 집합에서 빈번하게 발생하는 속성(attribute), 값(value)의 조건들을 나타내는 연관 규칙(association rule)을 발견하는 것이다. 즉 데이터 내에 존재하는 친화도나 패턴을 찾아 연관성이 많은 것을 발견해내는 것이다.
  • 분류는 일련의 범주들이 사전에 제시되어 있을 때, 특정한 데이터의 항목은 이러한 분류 체계 중 어디에 속하는 것을 밝히는 것을 말한다. 즉 데이터의 클래스나 개념을 설명하고, 구별하는 모델들의 집합을 찾는 과정이며, 그 모델을 이용하여 클래스의 레이블이 알려져 있지 않은 객체들의 클래스를 예측하는데 그 목적이 있다. 기존의 데이터에서 추출한 훈련 데이터(training data)를 토대로 이를 분석하여 모델을 유도한 다음 새로운 레이블을 예측하는 것이다.
  • 지금까지 데이터 마이닝의 개념과 그 과정에 대해 살펴보았다. 그렇다면 이러한 데이터 마이닝을 통해 우리는 어떤 의미와 패턴을 찾을 수 있는지 살펴보도록 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
데이터 마이닝이란? 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다.
연관성 분석은 무엇인가? 연관성 분석은 주어진 데이터의 집합에서 빈번하게 발생하는 속성(attribute), 값(value)의 조건들을 나타내는 연관 규칙(association rule)을 발견하는 것이다. 즉 데이터 내에 존재하는 친화도나 패턴을 찾아 연관성이 많은 것을 발견해내는 것이다.
데이터 마이닝 기능 중 예측형 범주는 무엇을 말하는가? 일반적으로 이러한 데이터 마이닝 기능은 서술형(descriptive) 범주와 예측형(predictive) 범주로 나눌 수 있다. 서술형 범주는 확보된 데이터에 결과 값이 없는 경우(unsupervised data) 주어진 데이터를 설명하는 패턴을 찾아 데이터 사용자가 이해할 수 있도록 표현하는 것을 말하고, 예측형 범주는 확보된 데이터에 결과 값이 있는 경우(supervised data) 주어진 데이터를 통해 모델을 생성하여 새로운 문제에 적용 가능한 값을 예측하는 것을 말한다. 즉 서술형 마이닝 작업은 데이터 속에 있는 일반적인 특성을 설명하는 것이고, 예측형 마이닝 작업은 미래 의사 결정에 관한 예측을 위해 현재 데이터들로부터 추론을 수행하는 것을 말한다.
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로