$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

빅데이터에 대한 Completeness를 이용한 빈발 패턴 마이닝
Frequent Pattern Mining By using a Completeness for BigData 원문보기

한국게임학회 논문지 = Journal of Korea Game Society, v.18 no.2, 2018년, pp.121 - 130  

박인규 (중부대학교 게임소프트웨어학과)

초록
AI-Helper 아이콘AI-Helper

대부분의 빈발 패턴은 패턴이 트랜잭션 데이터베이스에 나타나는 support를 패턴 interestingness의 핵심 척도로 다루어 왔으나 패턴의 횟수는 패턴의 completeness가 가지는 정보를 최대치로 가정하고 있다. 그러나 실제적으로는 임의의 패턴 X의 completeness는 트랜잭션에서 서로 다르게 나타나기 마련이다. 따라서 패턴이 가지는 정보의 손실을 줄이기 위해서는 가중치에 의한 support와 completeness에 의한 유용한 패턴 마이닝을 고려하여야 한다. 즉, 높은 completeness율을 갖는 패턴은 더 높은 recall로 이어질 수 있고 높은 빈도수를 갖는 패턴은 보다 높은 정밀도로 이어진다. 본 논문에서는 동적인 항목들의 가중치에 따른 적응된 support와 completeness를 고려하는 WSCFPM 패턴 마이닝 알고리즘을 제안한다. 제안한 방법은 모노톤 또는 반 모노톤 속성이 가중치에 의한 support와 completeness에 영향을 미치지 않기 때문에 탐색과정을 줄일 수 있다. 실험결과를 통하여 제안된 알고리즘이 효과적이며 확장성이 좋은 것임을 보인다.

Abstract AI-Helper 아이콘AI-Helper

Most of those studies use frequency, the number of times a pattern appears in a transaction database, as the key measure for pattern interestingness. It prerequisites that any interesting pattern should occupy a maximum portion of the transactions it appears. But in our real world scenarios the comp...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 이에 대한 일환으로 본 논문에서는 임계값의 최대치를 설정하지 않고 항목의 가중치에 의한 support와 트랜잭션에서의 항목비율을 이용하기 때문에 Anti-monotone 성질을 무효화하는 가중치에 따른 지지도와 트랜잭션의 완성도 기반 빈발 패턴(ACWFP: Weighted Support and Completeness Frequent Pattern) 알고리즘을 제안한다. 트랜잭션에서의 항목이 가지는 고유한 정보를 추출할 수 있고 단 한 번의 데이터베이스 스캔을 통하여 처리되므로 스트림 데이터 환경과 같은 실시간 처리가 필요한 환경에서 적용이 가능 하다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
데이터 마이닝이란? 데이터 마이닝은 데이터베이스의 트랜잭션 (Transaction)등의 데이터에서 빈번하게 발생하는 아이템들의 집합을 찾아내는 기법이다[1,2]. 초기의 빈발 패턴알고리즘은 FP-Growth방법을 활용하여 여러 가지 문제점을 극복하여 성능면에서 많은 개선을 가져오게 되었다.
MINWAL의 특징 및 단점은? 가중치 빈발패턴 알고리즘으로 초기에 Apriori 알고리즘 기반의 MINWAL, WARM와 WAR는 여러 번의 데이터베이스의 스캔으로 속도에 문제가 있다. MINWAL은 k-지지도를 이용하여 Anti-monotone성질을 유지하지만 빈발 항목의 정확도에서 효율성이 떨어진다. WARM에서 “ab” 항목의 가중치 지지도는 모든 트랜잭션의 가중치에 대한 “a” 와 “b”를 포함하는 트랜잭션의 가중치의 비율로 적용하여 하향폐쇄에 위배되는 문제를 해결하였다.
FP-Growth방법의 문제점은? 초기의 빈발 패턴알고리즘은 FP-Growth방법을 활용하여 여러 가지 문제점을 극복하여 성능면에서 많은 개선을 가져오게 되었다. 그러나 항목간의 중요도가 서로 상이한 환경서 이들은 각 항목의 중요도를 모두 같은 값으로 고려하고 있고 트랜잭션내에서의 항목의 비율은 고려하지 않고 있다[2]. 따라서 빈발패턴의 추출에서 패턴의 중요도에 대한 시변성 (Time-Variance)과 더불어 항목이 각각의 트랜잭션에서의 비율에 관한 많은 연구가 진행되어 왔다 [3,4,5].
질의응답 정보가 도움이 되었나요?

참고문헌 (13)

  1. S. Y. Hong, "New Authentication Methods based on User's Behavior Big Data Analysis on Cloud", Convergence Society for SMB, Vol. 6, No. 4, pp.31-36, 2016. 

  2. J. E. Shin, B. H. Jeong, D. H. Lim, "BigData Distribution System using RHadoop", Society of Data Information Science, Vol. 36, No. 5, pp. 1155-1166, 2015. 

  3. R. Agrawal, R. Srikant, "Fast Algorithm for Mining Association Rules", In: 20 th Int. Conf. on Very Large Data Bases, pp. 487-499, 1994. 

  4. C. H. Cai, A. W. C. Fu, C. H. Cheng, W. W. Kwong, "Mining Association rules with weighted items", In Proceedings of Intl. Database Engineering and Applications Symposium (IDEAS 1988) , Cardiff, Wales, UK, July pp. 68-77, 1998. 

  5. F. Tao, "Weighted association rule Mining using Weighted Support and Significant Framework", In:9th ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining", pp. 661-666, 2003. 

  6. W. Wang, J. Yang, P. S. Yu, "WAR: Weighted Association Rules Item Intensities", Knowledge Information and Systems, No. 6, pp. 203-229, 2003. 

  7. U. Yun, J. J. Leggett, "WFIM: Weighted Frequent Itemset Mining with a wieght range and a minimum weight", Society for Industrial and Applied Maathematics, Proceedings of the 2005 SIAM International Conference on Data Mining, pp.636-640, 2005. 

  8. U. Yun, "Efficient Mining of Weighted Interesting Patterns with A Strong Weight and/or Support Affinity", Information Sciences, Vol. 177, pp. 3477-3499, 2007. 

  9. U. Yun, "An Efficient Mining of Weighted Frequent Patterns with Length Decreasing Support Constraints", Knowlewdge-Based Systems, Vol. 21, Issue 8, Dec., pp. 741-752, 2008. 

  10. S. Zhang, C. Zhang, X. Yan, "Post-Mining: Maintenance of Association Rules by Weighting", Information Systems, Vol. 23, pp. 691-707, 2003. 

  11. H. L. Nguyen, "An Efficient Algorithm for Mining Weighted Frequent Itemsets Using Adaptive Weights", I.J. Intellogent Systems and Appillcations, Vol. 11, pp. 41-48, 2015. 

  12. C. F. Ahmed, S. K. Tanbeer, B. S. Jeong, "Mining Weighted Frequent Patterns using Adaptive Weightes", In: Fyfe et al. (Eds.): IDEAL 2008, LNCS 5326, pp. 258-265, 2008. 

  13. S. W. Jin, B. C. Kim, I. K. Um and Y. I. Kim, "Prototype Development of a Mobile Baseball Pitching Prediction Game using Data Mining Techinque", Journal of Advanced Information Technology and Convergence, Vol. 12, No. 02, pp.135-143, 2014. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로