$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

교통사고 데이터의 마이닝을 위한 연관규칙 학습기법과 서브그룹 발견기법의 비교
Comparison of Association Rule Learning and Subgroup Discovery for Mining Traffic Accident Data 원문보기

지능정보연구 = Journal of intelligence and information systems, v.21 no.4, 2015년, pp.1 - 16  

김정민 (부산대학교 전자전기컴퓨터공학과) ,  류광렬 (부산대학교 전자전기컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다. 본 논문에서는 많은 속성들로 표현된 교통사고 데이터로부터 유용한 패턴을 발견하기 위해 규칙 학습 기반의 데이터 마이닝 기법인 연관규칙 학습기법과 서브그룹 발견기법을 적용하였다. 연관규칙 학습기법은 비지도 학습 기법의 하나로 데이터 내에서 동시에 많이 등장하는 아이템(item)들을 찾아 규칙의 형태로 가공해 주며, 서브그룹 발견기법은 사용자가 지정한 대상 속성이 결론부에 나타나는 규칙을 학습하는 지도학습 기반 기법으로 일반성과 흥미도가 높은 규칙을 학습한다. 규칙 학습 시 사용자의 의도를 반영하기 위해서는 하나 이상의 관심 속성들을 조합한 합성 속성을 만들어 규칙을 학습할 수 있다. 규칙이 도출되고 나면 후처리 과정을 통해 중복된 규칙을 제거하고 유사한 규칙을 일반화하여 규칙들을 더 단순하고 이해하기 쉬운 형태로 가공한다. 교통사고 데이터를 대상으로 두 기법을 적용한 결과 대상 속성을 지정하지 않고 연관규칙 학습기법을 적용하는 경우 사용자가 쉽게 알기 어려운 속성 사이의 숨겨진 관계를 발견할 수 있었으며, 대상 속성을 지정하여 연관규칙 학습기법과 서브그룹 발견기법을 적용하는 경우 파라미터 조정에 많은 노력을 기울여야 하는 연관규칙 학습기법에 비해 서브그룹 발견기법이 흥미로운 규칙들을 더 쉽게 찾을 수 있음을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

Traffic accident is one of the major cause of death worldwide for the last several decades. According to the statistics of world health organization, approximately 1.24 million deaths occurred on the world's roads in 2010. In order to reduce future traffic accident, multipronged approaches have been...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 연관규칙 학습기법이나 서브그룹 발견기법은 이러한 연구들과는 달리 예측 성능을 극대화하는데 목적을 두지 않고 속성 사이의 관계를 잘 나타내는 규칙을 학습하는데 목적을 두고 있다. 연관규칙 학습기법은 지정된 대상 속성을 필요로 하지 않기 때문에 데이터에 대한 지식이 부족한 상태에서의 초기 연구에 활용하기 쉬우며, 사고 데이터의 경우 철도 사고 데이터를 가지고 사고에서 동시에 자주 등장하는 사고 요인들을 발견하는데 적용된 바 있다(Mirabadi and Sharifian, 2010).

가설 설정

  • 규칙 학습 시 사용자의 의도를 반영하기 위한 대상 속성은 데이터에 존재하는 속성 중 하나를 선정할 수도 있고, 관련 있는 여러 속성을 조합함으로써 만들 수도 있다. 만일 우리가 m개의 값과 n개의 값을 가지는 두 속성 Fi와 Fj를 조합한다고 가정해보자. 이 경우 두 속성을 조합한 속성은 m⋅n개의 대상 값을 가질 수 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
기존의 교통 데이터를 이용한 마이닝 연구의 문제점은 무엇인가? 교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다. 본 논문에서는 많은 속성들로 표현된 교통사고 데이터로부터 유용한 패턴을 발견하기 위해 규칙 학습 기반의 데이터 마이닝 기법인 연관규칙 학습기법과 서브그룹 발견기법을 적용하였다.
데이터 마이닝에서 패턴은 어떤 형태로 표현되며 어떤 정보를 제공하고 있는가? , 2011). 패턴은 규칙, 의사결정 트리, 특정 데이터의 집합과 같이 여러 가지 형태로 표현될 수 있으며 데이터의 특성이나 속성들 사이의 관계에 대한 정보를 제공한다. 어떤 패턴이 유용하다는 것은 패턴에 담긴 정보가 새롭고 향후에 유용하게 활용 가능하다는 것을 뜻한다.
데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있는 이유는? 교통사고의 원인을 규명하고 미래의 사고를 방지하기 위한 노력의 일환으로 데이터 마이닝 기법을 이용한 교통 데이터 분석의 연구가 이루어지고 있다. 하지만 기존의 교통 데이터를 이용한 마이닝 연구들은 학습된 결과를 사람이 이해하기 어려워 분석에 많은 노력이 필요하다는 문제가 있었다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. Agrawal, R. and R. Srikant, "Fast algorithms for mining association rules," Proceedings of the 20th Very Large Data Bases Conference, (1994), 487-499. 

  2. Atzmuller, M., "Mining Social Media: Key Players, Sentiments, and Communities," Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, Vol.2, No.5 (2012), 411-419. 

  3. Bayam, E., J. Liebowitz., and W. Agresti, "Older Drivers and Accidents: A Meta Analysis and Data Mining Application on Traffic Accident Data," Expert Systems with Applications, Vol.29, No.3(2005), 598-629. 

  4. Beshah, T. and S. Hill, "Mining Road Traffic Accident Data to Improve Safety: Role of Road Related Factors on Accident Severity in Ethiopia," Proceedings of the 2010 AAAI Spring Symposium Series, (2010), 14-19. 

  5. Brijs, T., D. Karlis., and G. Wets, "Studying the Effect of Weather Conditions on Daily Crash Counts using a Discrete Time-series Model," Accident Analysis & Prevention, Vol.40, No.3(2008), 1180-1190. 

  6. Chang, L. and W. Chen, "Data Mining of Tree-based Models to Analyze Freeway Accident Frequency," Journal of Safety Reserch, Vol.36, No.4(2005), 365-375. 

  7. Chong, M., A. Abraham, and M. Paprzycki, "Traffic Accident Analysis Using Machine Learning Paradigms," Informatica, Vol 29(2005), 89-98 

  8. Clark, P., and T. Niblett, "The CN2 Induction Algorithm," Machine Learning, Vol.3, No.4 (1989), 261-283. 

  9. Depaire, B., G. Wets, and K. Vanhoof, "Traffic Accident Segmentation by Means of Latent Class Clustering," Accident Analysis & Prevention, Vol.40, No.4(2008), 1257-1266. 

  10. Flach, P, Machine Learning: The Art and Science of Algorithms that Make Sense of Data, Cambridge University Press, New York, 2012. 

  11. Gamberger, D. and N. Lavrac, "Expert-guided Subgroup Discovery: Methodology and Application," Journal of Artificial Intelligence Research, Vol.17, No.1(2002), 501-527. 

  12. Lavrac, N., B. Kavsek., P. Flach., and L. Todorovski, "Subgroup Discovery with CN2-SD," Journal of Machine Learning Research, Vol.5(2004), 153-188. 

  13. Mirabadi, A. and S. Wets, "Application of Association Rules in Iranian Railways (RAI) Accident Data Analysis," Safety Science, Vol.48, No.10(2010), 1427-1435. 

  14. Natu, M. and G. K. Palshikar, "Interesting subset discovery and its application on service processes," Proceedings of the 2010 IEEE International Conference on Data Mining Workshops, (2010), 1061-1068. 

  15. Witten, I. H., et al., Data Mining: Practical Machine Learning Tools and Techniques (Third Edition). Morgan Kaufmann, Boston, 2011 

  16. Wrobel, S., "An algorithm for multi-relational discovery of subgroups," Proceedings of the First European Symposium on Principles of Data Mining and Knowledge Discovery, (1997), 78-87. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로