$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

LSA를 이용한 정형·비정형데이터 분석과 범죄 프로파일링 시스템 구현
Analysis of Structured and Unstructured Data and Construction of Criminal Profiling System using LSA 원문보기

멀티미디어학회논문지 = Journal of Korea Multimedia Society, v.20 no.1, 2017년, pp.66 - 73  

김용훈 (Dept. of Computer Engineering Pukyong National University) ,  정목동 (Dept. of Computer Engineering Pukyong National University)

Abstract AI-Helper 아이콘AI-Helper

Due to the recent rapid changes in society and wide spread of information devices, diverse digital information is utilized in a variety of economic and social analysis. Information related to the crime statistics by type of crime has been used as a major factor in crime. However, statistical analysi...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 범죄 수사 자료 중 정형화 되지 못한 비정형데이터를 정형데이터로 분석하여 보다 많은 정보를 전문 수사관 및 프로파일러에게 제공하여 직관적 수사, 즉 연역적 수사 및 귀납적 수사 방식으로 활용 할 수 있는 정확하고, 전문적인 정보를 수집, 분석 및 저장하는 시스템을 제안하고자 한다. 본 시스템은 수사자료 및 범죄 면담자료, 사회적 참고자료의 비정형데이터를 Ko-NLP(Korean Natural Lan-guage)[6]를 이용하여 1차 추출하고, 추출된 자료에서 일련의 Pattern을 생성하고, 생성된 Pattern은 별도로 저장하여 데이터 추출에 재사용된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
기존의 시스템에서 범죄의 중복된 항목을 인위적으로 결정하여 정형데이터로 작성하고, 이에 대한 항목을 입력자가 인위적으로 작성하는 것의 문제는 무엇인가? 기존의 시스템의 경우 범죄의 중복된 항목을 인위적으로 결정하여 정형데이터형태로 작성하고, 이에 대한 항목을 인위적으로 입력자가 사건의 내용을 작성하고 있다. 통계적 데이터를 추출하는 방법으로는 정확한 방법이지만, 데이터를 구축하기도 어렵고 발생빈도가 높은 정형데이터를 결정하기에도 부족한 부분이 많으며 결정된 이후 입력자의 실수가 있을 경우 전혀 다른 정보로 이용될 수 있다. 또한 현재의 시스템은 Boolean Search를 기본으로 사용하고 있어 하나의 Category를 선택 후 다른 Category를 선택하고 and, or를 사용함으로 단어의 중요도에 따른 정확한 결과 값을 반영하기 어렵다.
형태소 분석이란 무엇인가? 비정형 데이터 연구는 Ko-NLP와 유한 오토마타를 이용하며, Ko-NLP는 corpus에 품사를 부여하거나 형태소 해석의 모호한 결과로부터 한 가지 품사를 선정하는 작업을 태깅이라 한다. Ko-NLP(Korea Natural Language Process)는 이러한 자연어에 대한 형태소 분석을 하는 도구이며, 형태소 분석이란 실제의 문장에 사용되는 단어의 원래의 구조를 파악하는 것이다. 본 논문에서 HanNanum Ko-NLP Java version을 활용하여 형태소 분석을 한다.
사상함수를 상태 전이 함수(state transition function)라고 부르는 이유는 무엇인가? 사상함수는 한 상태에서 입력 Symbol을 보고 다른 상태로 이동하는 것을 나타내기 때문에 상태 전이 함수(state transition function)라 부르며, 그 형태에 따라 결정적 유한 오토마타(DFA : Deterministic Finite Automata)와 비결정적 유한 오토마타(NFA: Nondeterministic Finite Automata)로 나누어지며, 본 논문에서는 Ko-NLP로 분석된 자료를 바탕으로 어휘를 분석하여 패턴을 생성하였고, 패턴은 NFA를 적용하고, Fig. 1은 이러한 NFA를 적용한 상태 전이도이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. S. Lee and H. Yoon. "The Study on Strategy of National Information for Electronic Government of S. Korea with Public Data analysed by the Application of Scenario Planning," Journal of The Korea Institute of Electronic Communication Science, Vol 7, No 6, pp. 1259-1273, 2012. 

  2. D. Ferrucci and A Lally, "UIMA: An Architectural Approach to Unstructured Information Processing in the Corporate Research Environment," Journal of Natural Language Engineering, Vol. 10, No. 3-4, pp. 327-348, 2004. 

  3. B. Jang, S. Lee and K. Kwon, "Reversible Watermarking based Video Contents Management and Control technique using Biological Organism Model," Journal of Korea Multimedia Society, Vol 16, No 7, pp. 841-851, 2013. 

  4. S. Lim and C. Kim, "A Research on Conceptual Expandability and the Guidelines on Video Analysis of Moving Images from the Perspectives of Objects," Journal of Korea Multimedia Society, Vol 19, No 9, pp. 1738- 1746, 2016. 

  5. U. Kim, S. Park, J. Seo, H. Park and U. Park, Law and Institutional Improvement Maintenance Management System for Crime Statistics, Korea Institute of Criminology, pp. 13-16, 2015. 

  6. Hannanum KAIST Semantic Web Research Center(2010). http://semanticweb.kaist.ac.kr/home/index.php/HanNanum (accessed Mar., 21, 2011) 

  7. D. Willis, D.J. Pearce, and J. Noble, "Efficient Object Querying for Java," Proceeding of Journal of European Conference on Object- Oriented, pp. 28-49, 2006. 

  8. Y. Kim and M. Chung, "Construction of Criminal Profiling System utilizing Structured and Unstructured Data," Proceeding of The 12th International Conference on Multimedia Infromation Technology and Applications, pp 38-41, 2016. 

  9. T.K. Landauer, D.S. McNamara, S.D. Dennis, and W. Kintsch, Handbook of Latent Semantic Analysis, Lawrence Erlbaum, Mahwah, New Jersey, 2007. 

  10. J. Huh, and K. Seo, "A Case Study of the Base Technology for the Smart Grid Security: Focusing on a Performance Improvement of the Basic Algorithm for the DDoS Attacks Detection Using CUDA," Journal of Korea Multimedia Society, Vol. 19, No. 2, pp. 411- 417, 2016. 

  11. P.D. Turney and P. Pantel, "From Frequency to Meaning: Vector Space Models of Semantics," Journal of Artificial Intelligence Research, 37, pp. 141-188, 2010. 

  12. G. Saltron, A. Wong, and C.S. Yang, "Vector Space Model for Automatic Indexing," Journal of Communications of the Association for Computing Machinery, Vol. 18, No 11, pp. 613-620, 1975. 

  13. J. Huh and S. Koh, "Advanced Metering Infrastructure Design and Test Bed Experiment Using Intelligent Agents," Journal of Supercomputing, Vol. 72, No. 5, pp. 1862- 1877, 2016. 

  14. H. Song and O. Kwon, "An Approximation Algorithm based on First-fit Strategy for Template Packing Problem," Journal of Korea Multimedia Society, Vol 19, No 2, pp. 443-450, 2016. 

  15. S. Yang and M. Chung, "A Context-Aware Information Service using FCM Clustering Algorithm and Fuzzy Decision Tree," Journal of Korea Multimedia Society, Vol 16, No 7, pp. 810-819, 2013. 

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로