$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

데이터 마이닝과 텍스트 마이닝의 통합적 접근을 통한 병사 사고예측 모델 개발
Development of the Accident Prediction Model for Enlisted Men through an Integrated Approach to Datamining and Textmining 원문보기

지능정보연구 = Journal of intelligence and information systems, v.21 no.3, 2015년, pp.1 - 17  

윤승진 (국방대학교 군사운영분석학과) ,  김수환 (국방대학교 군사운영분석학과) ,  신경식 (이화여자대학교 경영대학)

초록
AI-Helper 아이콘AI-Helper

최근, 군에서 가장 이슈가 되고 있는 문제는 기강 해이, 복무 부적응 등으로 인한 병력 사고이다. 이 같은 사고를 예방하는 데 있어 가장 중요한 것은, 사고의 요인이 될 수 있는 문제를 사전에 식별 관리하는 것이다. 이를 위해서 지휘관들은 병사들과의 면담, 생활관 순찰, 부모님과의 대화 등 나름대로의 노력을 기울이고 있기는 하지만, 지휘관 개개인의 역량에 따라 사고 징후를 식별하는 데 큰 차이가 나는 것이 현실이다. 본 연구에서는 이러한 문제점을 극복하고자 모든 지휘관들이 쉽게 획득 가능한 객관적 데이터를 활용하여 사고를 예측해 보려 한다. 최근에는 병사들의 생활지도기록부 DB화가 잘 되어있을 뿐 아니라 지휘관들이 병사들과 SNS상에서 소통하며 정보를 얻기 때문에 이를 데이터화 하여 잘 활용한다면 병사들의 사고예측 및 예방이 가능하다고 판단하였다. 본 연구는 이러한 병사의 내부데이터(생활지도기록부) 및 외부데이터(SNS)를 활용하여 그들의 관심분야를 파악하고 사고를 예측, 이를 지휘에 활용하는 데이터마이닝 문제를 다루며, 그 방법으로 토픽분석 및 의사결정나무 방법을 제안한다. 연구는 크게 두 흐름으로 진행하였다. 첫 번째는 병사들의 SNS에서 토픽을 분석하고 이를 독립변수화 하였고 두 번째는 병사들의 내부데이터에 이 토픽분석결과를 독립변수로 추가하여 의사결정나무를 수행하였다. 이 때 종속변수는 병사들의 사고유무이다. 분석결과 사고 예측 정확도가 약 92%로 뛰어난 예측력을 보였다. 본 연구를 기반으로 향후 장병들의 사고예측을 과학적으로 분석, 맞춤식으로 관리한다면 군대 내 각종 사고를 미연에 예방하는데 기여할 것으로 기대된다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we report what we have observed with regards to a prediction model for the military based on enlisted men's internal(cumulative records) and external data(SNS data). This work is significant in the military's efforts to supervise them. In spite of their effort, many commanders have fa...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 군에서는 아직까지 객관적이고 정량적인 근거 자료에 의한 합리적인 의사결정체계가 정립되어 있지 않고 많은 부분 주관적이고 정성적인 의사 결정이 주를 이룬다.(Kim, 2014) 이에 본 논문에서는 병사 SNS를 통해 핵심 키워드를 도출하고 기존의 생활지도기록부 데이터와 접목하여 사고를 예측할 수 있는 모델을 만들어 보고자 한다. 병 SNS 핵심 키워드 추출을 위한 방법으로는 텍스트 마이닝 기법 중 토픽분석을 수행하고 사고 예측 모델은 의사결정나무 방법을 사용한다.
  • 기존에는 구조화된 정형 데이터를 활용하는 형태에서 최근에는 웹과 소셜 미디어 등을 통해 급증하고 있는 텍스트 형태의 비구조화된 비정형 데이터를 분석하여 새롭고 유용한 정보를 얻기 위한 노력이 확산되고 있다.(Liu, 2012) 본 연구에서는 병사들의 기존 생활지도기록부 상 내부 데이터와 그들의 SNS를 토픽분석한 자료를 포함하여 데이터 마이닝을 하여 모델을 만들고 모델을 통해 사고를 예측할 수 있는 방안을 제시하고자 한다. 구체적으로는 (1) 병사들의 SNS 토픽 분석을 통해 그들의 관심 분야를 파악하고 (2) 이를 독립변수화 하여 기존의 내부 데이터들과 함께 의사결정 나무를 만들고, 그 결과를 분석할 것이다.
  • 그렇다면 이제 토픽분석을 통해 확보한 SNS자료를 독립변수로 추가하여 두 번째 의사결정 나무 모형을 구성해 보자. 그 방법은 앞 절의 방법과 동일하고 독립변수에 토픽분석결과(훈련, 친구, 휴가, 운동, 스트레스/짜증)가 추가되는 형태이다.
  • 본 연구에서는 지휘관들이 손쉽게 획득 가능한 데이터를 기반으로 데이터 분석방법인 토픽 분석과 의사결정나무를 적용하여 사고 가능성이 있는 병사를 예측하는 문제를 모델링 하였다. 특히, 생활지도기록부에서 획득 가능한 변수만을 활용한 것이 아니라 SNS와 같은 비정형 데이터를 토픽분석을 통해 정형데이터로 변형, 독립변수로 추가하여 92%의 높은 예측 정확도를 보이는 모델을 구축하였다.
  • 본 연구에서의 의의로는 첫째, 최근 이슈가 되고 있는 텍스트 분석을 기존 정형 데이터 마이닝과 접목시켰다는 점과 둘째는 군에서 사고를 예측하는 정량적 분석방법을 제시하였다는 것이다. 이 모델을 통해 군에서는 사고 가능성이 있는 병사를 조기에 식별하고 이를 집중 관리함으로써 병영 내 사고를 획기적으로 줄일 수 있다고 확신한다.
  • 첫 번째는 기존 생활지도기록부 데이터만을 독립변수로 활용하여 의사결정나무를 구성해 보는 것과 두 번째는 비정형 데이터를 정형 데이터화 한 토픽분석결과를 포함하여 의사결정나무를 구성해 보는 것이다. 이 두 실험을 통해 군대에 축척되어 있는 병사들의 데이터에서 data driven 기법으로 사고를 예측해 볼 것이고, 또한 기존의 사고예측 모형에서는 볼 수 없었던 실시간 SNS 비정형 데이터를 정형데이터와 같이 활용해 사고 예측 정확도를 더욱 높일 수 있는 모델을 구축하려 한다.
  • 이를 적절히 활용한다면 보다 쉽게 그들의 속마음을 확인할 수 있고 이를 지휘참고 자료로도 충분히 활용할 수 있을 것이다. 이런 자료들을 활용, 데이터 마이닝을 통해 병사들의 사고를 예측하는 모델을 만들 수 있다는 아이디어 하에 본연구를 시작하게 되었으며, 기존의 데이터 및 병 SNS 자료를 과학적으로 분석하여 사고를 예측할 수 있는 방안을 제시하였다.

가설 설정

  • 토픽분석은 문서 집합 내에서 동시 출현빈도가 높은 단어 들을 기준으로 유사한 주제로 문서들을 그룹화한다. 특히, 개별문서와 주제가 일대일 매칭 개념이 아닌 여러 주제를 다룰 수 있다는 점을 가정하고 있다. 병사들의 SNS에서 추출된 토픽은 단어들의 집합으로 파악할 수 있으며, 문서집합 내에서의 해당 토픽의 출현 빈도는 그것에 대한 관심도를 반영한다고 볼 수 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
데이터 마이닝을 통한 예측모형의 대표적인 분야는? 데이터 마이닝을 통한 예측모형은 다양한 분야에서 많이 연구되었으며 그중 대표적인 것은 부도예측 및 주가예측 분야다. 국가적, 개인적으로 많은 손실을 가져오는 기업의 부도를 예측모 형화 하고자 하는 시도는 1930년대 이후 지속적 으로 발전하였다.
사용자들이 스마트 시대에 정보를 표현하고 획득하는 가장 일반적인 방식은 무엇인가? 이 비정형 텍스트 데이터는 토픽분석을 통해 의미를 도출 하였다. 텍스트는 사용자들이 스마트 시대에 정보를 표현하고 획득하는 가장 일반적인 방식 (Witten, 2004)인데 최근에는 이러한 텍스트에 대해 분석을 하고 의미있는 정보를 추출하기 위한 연구가 지속적으로 수행되고 있다. 먼저 텍스트 형태의 데이터를 분석하기 위해서는 텍스트 전처리 단계(형태소 분석, 의미정보 변환 및 추출) 를 실시한 후 텍스트 문서 집합 내에 잠재된 주제를 도출하는 토픽분석을 수행한다.
본문의 연구에서 그룹화하는 과정에서 발생하는 치우침을 배제할 수 없는 이유는? 본 연구의 한계점은 다음과 같다. 의사결정나무의 특성상 연속형 데이터를 처리하는 능력이 신경망이나 통계기법에 비해 떨어지며, 결과적으로 예측력도 감소한다. 따라서 이번 연구시에도 모든 변수를 범주형으로 변화시켜 사용하였는데 그룹화하는 과정에서 발생하는 치우침을 배제할 수 없다.
질의응답 정보가 도움이 되었나요?

참고문헌 (22)

  1. Albright, R., Taming Text with the SVD, SAS Institute Inc., 2006. 

  2. Beaver, W., "Financial ratios as predictors of failure. Empirical research in Accounting; Selected studies," Journal of Accounting Research, Vol. 5(1966), 71-111. 

  3. Bergerson, K. and D. C. Wunsch, "A Commodity Trading Model Based on a Neural Network-Expert System Hybrid," Proceedings of the IEEE International conference on Neural Networks, Seattle, Washington, (1991). 

  4. Casey, C., McGee, V. and C. Stickney, "Discriminating between reorganized and liquidated firms in bankruptcy," The Accounting Review, April (1986), 249-262. 

  5. Emery, G. W. and K. O. Cogger, "The measurement of liquidity," Journal of Accounting Research, Vol. 20, No. 2(1982), 290-303. 

  6. Hand, D. J., Mannila, H., and P. Smyth, Principles of Data Mining, Cambridge, MA:MIT Press, 2001. 

  7. Hanweak, G. A., "Predicting Bank Failure - Research Papers in Banking and Economics," Financial Studies Section, FRB, November (1977). 

  8. Hong S.-H. and K.-S. Shin, "Using GA based Input Selection Method for Artificial Neural Network Modeling: Application to Bankruptcy Prediction," Journal of Intelligence and Information Systems, Vol.9, No.1(2003), 227-249 

  9. Johnson, W. B., "The Cross-Sectional Stability of Financial Ratio Patterns," Journal of Financial and Quantitative Analysis, Vol. 14, No. 5(1979), 97-108. 

  10. Jung, J. B., "A proposal of new method of recruits classification using a statistical clustering," Proceedings of the Korean Institute of Industrial Engineers, (2009), 401-411. 

  11. Kang, K. Y., "Effective assignment method to promote recruit's proficiency," Master's Dissertation, Korea National Defense University, 2010. 

  12. KIDA, "Interpretation of Aptitude Adaptation Degree," 2012. 

  13. Kim, S.-W, G.-G. Kim, and B.-K. Yoon, "A Study on a way to usilize Big data Analytics in the Defense Area," The Korean Operations Research and Management Science Society, Vol.39, No.2(2014), 133-134. 

  14. Kim, H. S., "A study of recruit's assignment method using AHP and goal programming," Master's Dissertation, Korea National Defense University, 1998. 

  15. Kim, Y.-S., N.-G. Kim, and S.-R. Jeong, "Stock-Index Invest Model Using News Big Data Opinion Mining," Journal of Intelligence and Information System, Vol.18, No.2(2012), 143-156. 

  16. Lee, E. G., and S. Y. Park, "Emotional & Behavioral problems in children from Broken Families," Journal of the Korean Home Economics Association, Vol. 42, No.12(2004), 191-204. 

  17. Liu, B., Sentiment Analysis and Opinion Mining, Morgan & Claypool Publishers, 2012. 

  18. Martin, D., "Early Warning of Bank Failure: A Logit Regression Approach," Journal of Banking and Finance, Vol. 1, No. 3(1977), 249-276. 

  19. Ok, J.-K. and K.-J. Kim, "Integrated Corporate Bankruptcy Prediction Model using Genetic Algorithms," Journal of Intelligence and Information System, Vol.15, No.4(2009), 99-120. 

  20. Salton G. and M. J. McGill, Introduction to modern information retrieval, McGraw-Hill, 1983. 

  21. Yang, W. "Stock price predictin vased on fuzzy logic," Proceedings of the Sixth International Conference on Machine Learning and Cybernetics, Vol.3(2007), 19-22. 

  22. Witten, I, H., Text Mining, Practical Handbook of Internet Computing, CRC Press, 2004. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로