$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

유용한 연관 규칙 추출을 위한 시각적 탐색 기반 접근법
Visual Exploration based Approach for Extracting the Interesting Association Rules 원문보기

韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information, v.18 no.9, 2013년, pp.177 - 187  

김준우 (동아대학교 산업경영공학과) ,  강현경 (신라대학교 치위생학과)

초록
AI-Helper 아이콘AI-Helper

연관 규칙 탐사는 다양한 분야에서 널리 쓰이는 데이터 마이닝 기법으로 트랜잭션 데이터에 포함된 이산적인 항목들 간의 인과관계를 추출하는데 목적을 둔다. 하지만 분석자들은 때로 방대한 양의 데이터에서 추출된 많은 연관규칙들을 해석하고 활용하는데 곤란을 겪기도 한다. 이러한 문제점을 해결하기 위하여 본 논문에서는 주어진 트랜잭션 데이터에서 유용한연관 규칙을 탐색하기 위한 새로운 방법인 HTM 접근법을 제안하고자 한다. HTM 접근법은 크게 계층 군집, 테이블 뷰 및 모자이크 플롯의 세 가지 단계로 구성되며, 각 단계는 분석자들에게 적절한 시각적 표현을 제공한다. 예시를 위해 본 논문에서는 상기 접근법을 건강 검진 결과 데이터 분석에 적용하였으며, 실험결과 HTM 접근법을 통해 분석자들은 유용한 규칙들을 보다 효과적으로 탐색할 수 있을 것으로 기대된다.

Abstract AI-Helper 아이콘AI-Helper

Association rule mining is a popular data mining technique with a wide range of application domains, and aims to extract the cause-and-effect relations between the discrete items included in transaction data. However, analysts sometimes have trouble in interpreting and using the plethora of associat...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 HTM 접근법을 단체 건강 검진 결과 데이터에 적용하여 그 유용성을 검증해보고자 한다. 건강 검진 데이터에는 인구통계학적 문항과 키나 체중 등과 같은 연속 변수 문항도 존재하지만, 특정 질환 유무에 대한 검사 항목이나 생활 습관에 대한 설문 항목들의 대다수가 이진 문항으로 구성되어 있어, 이러한 항목들만 분리시킬 경우, 트랜잭션 데이터를 형성하게 된다.
  • 한편, 트랜잭션 데이터의 경우에는 계층 군집을 통해 종래와 같이 레코드들의 군집을 생성하는 대신, 항목들의 군집을 생성하기 위한 분석이 가능하며, 이러한 예로는 고객들의 상품 별 선호도 조사 데이터를 이용하여 같은 고객이 선호할 가능성이 큰 상품들이 가까이 배치되는 상품 계통도[23]나 IT 관련 기사들을 분석하여 같은 기사에 등장하는 키워드들을 가까이 배치하는 키워드 계통도[24]를 얻은 연구들이 존재한다. 본 논문에서는 이와 같이 트랜잭션 데이터를 구성하는 항목들에 대한 계통도를 생성하는 계층 군집을 통하여 분석자가 연관 규칙 탐사를 실시하기 전에 미리 대상 데이터에 대한 직관적인 이해를 하고, 분석 대상 항목들을 선별할 수 있도록 하고자 한다. 연관 규칙 탐사와 관련해서는 추출된 규칙들에 대하여 계층 군집을 적용, 연관 규칙들을 나열하는 사례[14]가 있었으나, 본 논문에서는 연관 규칙 탐사 이전에 사전 분석 목적으로 계층 군집을 이용한다는 점에서 차이가 있다.
  • 이러한 맥락에서 본 논문에서는 분석자가 좀 더 직관적인 절차를 통해 유용한 연관 규칙을 찾는데 사용할 수 있는 방법인 HTM(Hierarchy-Table-Mosaic) 접근법을 제안하고자 한다. HTM은 크게 계층 군집, 테이블 뷰, 모자이크 플롯의 3가지 단계로 구성되며, 1단계인 계층 군집에서는 트랜잭션 데이터에 존재하는 단일 항목들에 대한 계층 구조를 추출하여 보여주며, 이 때 항목 간의 연관성으로는 지지도나 신뢰도 등의 지표를 사용할 수 있다.

가설 설정

  • 예를 들어, 위 그림 4~그림 7에서는 항목 5, 6, 3이 서로 관련성이 있음이 파악되고, 이는 곧, 부정교합, 치주질환, 구내염이 서로 어느 정도 상관관계가 있음을 의미한다. 이번에는 이들에 대하여 좀 더 자세한 분석을 하는 상황을 가정해보자. HTM 접근법의 두 번째 단계는 선택된 항목들에 대한 연관 규칙 탐사를 실행하는 것으로 시작된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
단일 항목 간 계층 구조는 분석자가 무엇을 할 수 있게 해 주는가? HTM은 크게 계층 군집, 테이블 뷰, 모자이크 플롯의 3가지 단계로 구성되며, 1단계인 계층 군집에서는 트랜잭션 데이터에 존재하는 단일 항목들에 대한 계층 구조를 추출하여 보여주며, 이 때 항목 간의 연관성으로는 지지도나 신뢰도 등의 지표를 사용할 수 있다. 이러한 단일 항목 간 계층 구조는 분석자가 서로 연관성이 높은 항목들의 그룹을 직관적으로 파악할 수 있게 해 준다. 이를 통해 분석자가 분석 대상 항목을 선택하면, 선택된 항목들로 범위를 좁혀 연관 규칙 탐사를 실시하며 이 과정에서는 Apriori 알고리즘 등을 사용할 수 있다.
연관 규칙 탐사는 항목의 종류가 많은 대용량 데이터를 분석하는 경우에 어떤 어려움을 겪게 되는가? 그러나 항목의 종류가 많은 대용량 데이터를 분석하는 경우에는 분석 결과로 산출되는 연관 규칙의 개수도 함께 늘어나기 때문에 종래와 같이 텍스트 형태로 추출된 연관 규칙을 나열해서는 분석자가 이를 해석하고 유용한 연관 규칙을 찾아 활용하는데 많은 어려움을 겪게 된다[4, 5]. 이에 따라 분석자가 유용한 연관 규칙을 효과적으로 찾을 수 있게 하는 방법에 대한 연구가 지속적으로 이루어져 왔으며, 대표적으로는 연관 규칙 탐사 과정에서 적절한 시각화(visualization) 기능을 제공하여 사람의 시각적 인지 능력 및 정보 처리 능력을 활용하고자 하는 것을 들 수 있다.
HTM을 3가지 단계로 나누어 보시오. 이러한 맥락에서 본 논문에서는 분석자가 좀 더 직관적인 절차를 통해 유용한 연관 규칙을 찾는데 사용할 수 있는 방법인 HTM(Hierarchy-Table-Mosaic) 접근법을 제안하고자 한다. HTM은 크게 계층 군집, 테이블 뷰, 모자이크 플롯의 3가지 단계로 구성되며, 1단계인 계층 군집에서는 트랜잭션 데이터에 존재하는 단일 항목들에 대한 계층 구조를 추출하여 보여주며, 이 때 항목 간의 연관성으로는 지지도나 신뢰도 등의 지표를 사용할 수 있다. 이러한 단일 항목 간 계층 구조는 분석자가 서로 연관성이 높은 항목들의 그룹을 직관적으로 파악할 수 있게 해 준다.
질의응답 정보가 도움이 되었나요?

참고문헌 (26)

  1. R. Agrawal, T. Imielinski, and R. Swami, "Mining Associations between Sets of Items in Massive Databases," Proceedings of the ACM-SIGMOD 1993 International Conference on Management of Data, pp. 207-216, 1993. 

  2. R. Agrawal, and R. Srikant, "Fast Algorithms for Mining Association Rules," Proceedings of the International Conference on Very Large Databases, pp. 125-131, 1994. 

  3. P.-N. Tan, M. Steinbach, and V. Kumar, "Introduction to Data Mining," Addison-Wesley, 2005. 

  4. A. Jorge, "Hierarchical Clustering for Thematic Browsing and Summarization of Large Sets of Association Rules," Proceedings of the 2004 SIAM International Conference on Data Mining, 2004. 

  5. L. A. Fernandes, and A. C. B. Garcia, "Association Rule Visualization and Pruning through Response-Style Data Organization and Clustering," In Advances in Artificial Intelligence-IBERAMIA, pp. 71-80, 2012 

  6. Y. A. Sekhavat, and O. Hoeber, "Visualizing Association Rules Using Linked Matrix, Graph, and Detail Views," International Journal of Intelligence Science, Vol. 3, pp. 34-49, 2013. 

  7. B. Schneiderman, "The Eyes Have It: A Task by Data Type Taxonomy for Information Visualization," Proceedings of the IEEE Symposium on Visual Languages, pp. 336-343, 1996. 

  8. M. Klemettinen, H. Mannila, P. Ronkainen, H. Toivonen, and A. I. Verkamo, "Finding Interesting Rules from Large Sets of Discovered Association Rules," Proceedings of the 3rd International Conference on Information and Knowledge Management, pp. 401-407, 1994. 

  9. P. C. Wong, P. Whitney, and J. Thomas, "Visualizing Association Rules for Text Mining," Proceedings of the 1999 IEEE Symposium on Information Visualization, pp. 120-123, 1999. 

  10. C. Romero, J. M. Luna, J. R. Romero, and S. Ventura, "RM-Tool: A Framework for Discovering and Evaluating Association Rules," Advances in Engineering Software, Vol. 42, No. 8, pp. 566-576, 2011. 

  11. R. J. Bayardo, and R. Agrawal, "Mining the Most Interesting Rules," Proceedings of the 5th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 145-154, 1999. 

  12. M. Hahsler, and S. Chellubonia, "Visualizing Association Rules: Introduction to the R-extension Package arulesViz,", R project module, 2011. 

  13. K. Techapichetvanich, and A. Datta, "VisAR: A New Technique for Visualizing Mined Association Rules," In Advanced Data Mining and Applications, Springer Berlin Heidelberg, pp. 88-95, 2005. 

  14. Y. H. Fua, M. O. Ward, and E. A. Rundensteiner, "Hierarchical Parallel Coordinates for Exploration of Large Datasets," Proceedings of the Conference on Visualization '99, pp. 43-50, 1999. 

  15. P. Buono, and M. F. Costabile, "Visualizing Association Rules in a Framework for Visual Data Mining," In Integrated Publication and Information Systems to Information and Knowledge Environments, Springer Berlin Heidelberg, pp. 221-231, 2005. 

  16. L. Yang, "Pruning and Visualizing Generalized Association Rules in Parallel Coordinates," IEEE Transactions on Knowledge and Data Engineering, Vol. 17, No. 1, pp. 60-70, 2005. 

  17. L. Yang, "Visual Exploration of Frequent Itemsets and Association Rules," In Visual Data Mining: Theory, Techniques and Tools for Visual Analytics, Springer Berlin Heidelberg, pp. 60-75, 2008. 

  18. M. Hahsler, and S. Chellubonia, "Visualizing Association Rules in Hierarchical Groups," Proceedings of the 42nd Symposium on the Interface: Statistical, Machine Learning, and Visualization Algorithms, 2011. 

  19. K. H. Ong, K. L. Ong, W. K. Ng, and E. P. Lim, "Crystalclear: Active Visualization of Association Rules," Proceedings of the ICDM-02 Workshop on Active Mining, 2002. 

  20. O. Couturier, T. Hamrouni, S. B. Yahia, and E. M. Nguifo, "A Scalable Association Rule Visualization towards Displaying Large Amounts of Knowledge," Proceedings of 11th International Conference on Information Visualization IV, Vol. 7, pp. 657-663, 2007. 

  21. W. H. E. Day, and H. Edelsbrunner, "Efficient Algorithms for Agglomerative Hierarchical Clustering Method," Journal of Classification, Vol. 1, No. 1, pp. 7-24, 1984 

  22. A. Guenoche, P. Hansen, and B. Jaumard, "Efficient Algorithms for Divisive Hierarchical Clustering," Journal of Classification, Vol. 8, No. 1, pp. 5-30, 1991. 

  23. B. Sarwar, G. Karypis, J. Konstan, and J. Riedl, "Item-based Collaborative Filtering Recommendation Algorithms," Proceedings of the 10th International Conference on World Wide Web, pp. 285-295, 2001. 

  24. C.-J. Tsui, P. Wang, K. R. Fleischmann, A. B. Sayeed, and A. Weinberg, "Building an IT Taxonomy with Co-occurrence Analysis, Hierarchical Clustering and Multidimensional Scaling," Proceedings of iConference, pp. 247-256, 2010. 

  25. H. Hofmann, A. P. Siebes, and A. F. Wilhelm, "Visualizing Association Rules with Interactive Mosaic Plots," Proceedings of the ACMKDD International Conference on Knowledge Discovery and Data Mining, pp. 227-235, 2000. 

  26. A. Strehl, G. K. Gupta, and J. Ghosh, "Distance Based Clustering of Association Rules," Proceedings of ANNIE 1999, ASME Press, pp. 759-764, 1999. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로