최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.2 no.12, 2013년, pp.855 - 864
안형근 (울산대학교 LINC사업단) , 고재진 (울산대학교 전기공학부)
Decision tree classification is one of the important problems in data mining fields and data minings have been important tasks in the fields of large database technologies. Therefore the coupling efforts of data mining systems and database systems have led the developments of database primitives sup...
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
데이터 마이닝의 SQL 활용 기법의 특징은? | 데이터 마이닝하기 위한 데이터는 대부분 데이터베이스 시스템(이하 DBMS)에 저장되고, 이 DBMS는 데이터 접근(access), 필터링(filtering), 인덱싱(indexing)하는 구현 기능들을 갖고 있다. 데이터 마이닝의 SQL 활용 기법은 대용량 데이터 처리, 병렬화, 필터링, 집계 기능 등과 같은 DBMS 기술을 주로 활용하고 데이터 자체뿐만 아니라 질의어 처리 결과를 마이닝 하는 것이 특징 이다[1,11]. 그러나, 처리 성능이 낮아 조인, 그룹핑, 집계 같은 SQL 연산만으로 데이터 마이닝 기능을 수행하기에는 충분하지 않은 문제점이 있어 SQL 연산의 최적화를 위한 인덱싱 기법을 사용하기도 하고, 또한, 효율적인 구현을 위해서 데이터 마이닝 기능들이 DBMS에서 연산이나 접근 패턴및 접근 경로 등의 지식을 활용하기도 한다. | |
기존 연구들에서 데이터 마이닝 기능과 관련하여 서술된 DBMS의 구현 기능은? | 기존 연구들은 주로 판단 트리 분류를 이용하여 데이터 마이닝 기능들을 확인하고 DBMS의 구현 기능들을 이용하였으며, DBMS에서는 데이터 마이닝 기능들을 지원할 몇 가지 기술들을 서술하고 있다[2, 3]. 첫째는 연관 규칙에 대한 새로운 언어 구성을 SQL에 추가하는 것, 둘째는 데이터 마이닝을 위한 OLE DB 같은 특수한 API를 사용하거나 사용자 정의 타입과 메소드를 사용해서 데이터 마이닝 기능을 내부적으로 구현, 셋째는 DBMS가 데이터 마이닝에 유용한 특수한 연산자나 기초 기능을 제공하는 것 등이 있다. 이 모든 방법들이 데이터 마이닝 기능들에 유용하지만 본 논문에서는 상기 내용에서 기술한 문제점 해결을 위하여 특수한 연산자나 기초 기능의 세 번째 기술 관점에서 연구가 진행되었다[11]. | |
데이터 마이닝하기 위한 데이터는 대부분 어디에 저장되는가? | 판단 트리 분류는 데이터 마이닝의 중요한 문제의 하나이고, 데이터 마이닝은 대형 데이터베이스 기술에서 중요한 위치를 차지하고 있다. 데이터 마이닝하기 위한 데이터는 대부분 데이터베이스 시스템(이하 DBMS)에 저장되고, 이 DBMS는 데이터 접근(access), 필터링(filtering), 인덱싱(indexing)하는 구현 기능들을 갖고 있다. 데이터 마이닝의 SQL 활용 기법은 대용량 데이터 처리, 병렬화, 필터링, 집계 기능 등과 같은 DBMS 기술을 주로 활용하고 데이터 자체뿐만 아니라 질의어 처리 결과를 마이닝 하는 것이 특징 이다[1,11]. |
Surajit Chaudhuri, "Data Mining and Database Systems: Where is the Intersection?," Data Engineering Bulletin, 21(1): 4-8, 1998.
R. Meo, G. Psaila, and S. Ceri. A New SQL-like Operators for Mining Association Rules. VLDB'96, pp. 122-133, Mumbai, India, Sept., 3-6, 1996. R.
A. Netz, S. Chaudhuri, J. Bernhardt, and U. M. Fayyad, "Integration of Data Mining with Database Technology," Proceedings of 26th International Conference on Very Large Data Bases, September 10-14, 2000.
Vipin Kumar, etc., Introduction to data mining, Addison-Wesley, May 12, 2005.
L. Breiman, J. H. Friedman, R. A. Olshen, and C. J. Stone, "Classification and Regression Trees," Chapman and Hall, 1984.
M. Mehta, I. Rissanen, and R. Agrawal, "MDL-based Decision Tree Pruning," Proc. of Intl. Conf. on Knowledge Discovery in Databases and Data Mining, Montreal, Canada, 1995.
S. Chaudhuri, U. M. Fayyad, and J. Bernhardt, "Scalable Classification over SQL Databases," ICDE-99, pp.470-479, Sydney, Australia, 1999.
J. Gerhke, R. Ramakrishnan, and V. Ganti, "RainForest - A Framework for Fast Decision Tree Construction of Large Datasets," VLDB'98, pp.416-427, New York City, New York, USA, 1999.
S.B. Kotsiantis, D. Kanellopoulos and P.E. Pintelas, "Data Preprocessing for supervised learning," International Journal of Computer Science, Vol.1, No.2, 2006.
M. BenHajHmida and A. Congiusta, "Parallel, distributed, and grid-based data mining : algorithms, systems, and applications," Handbook of Research on Computational Grid, IGI Global, pp.90-119, May, 2009.
L. Zhou, Z. Zhang, and M. Xu, "Massive data mining based on item sequence set grid space," In Proceedings of the 2nd International Asia Conference on Informatics in Control, Automation and Robotics, pp.208-211, March, 2010.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.