$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

데이터 마이닝 기법을 이용한 XML 문서의 온톨로지 반자동 생성
Semi-Automatic Ontology Generation about XML Documents using Data Mining Method 원문보기

정보처리학회논문지. The KIPS transactions. Part D. Part D, v.13D no.3 = no.106, 2006년, pp.299 - 308  

구미숙 (충북대학교 전자계산학과) ,  황정희 (남서울대학교 컴퓨터학과) ,  류근호 (충북대학교 전기전자 컴퓨터공학부) ,  홍장의 (충북대학교 전기전자 컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법연관규칙 알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.

Abstract AI-Helper 아이콘AI-Helper

As recently XML is becoming the standard of exchanging web documents and public documentations, XML data are increasing in many areas. To retrieve the information about XML documents efficiently, the semantic web based on the ontology is appearing. The existing ontology has been constructed manually...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 관광관련 사이트에 사용자들로부터 자주 발생하는, "제주도에 있는 용두암을 여행할 때 적절한 숙박 시설을 검색하시오., , 와 같은 질의에서, “용두암”은 “관광지이름, , 중의 하나이고, 호텔”은, , 숙박시설”중의 하나이다.
  • 많이 소요된다. 그러므로 이 논문에서는 데이터 마이닝 기법을 이용한 반자동 온톨로지 생성 기법을 제안하며, 이 기법은 사용자의 특정 도메인 내의 정보검색에 대하여 사용자에게 효율적인 정보를 제공하는데 도움을 준다.
  • 온톨로지 구축 방법의 연구가 필요하다. 그러므로 이 논문에서는 현재 웹 데이터의 표준인 XML 문서로부터 온톨로지를 생성하는 방법을 제안한다.
  • 생성되면 파싱을 수행하게 된다. 그리고 온톨로지 기반토픽맵 엔진의 처리 과정을 수행하여 온톨로지 데이터베이스에 저장되며, 사용자 인터페이스를 통해서 사용자의 질의에 알맞은 검색 결과를 제시해 준다.
  • 현재의 웹에 의미정보를 추가하여 정보 검색에 효율성을 기하기 위해 새로운 패러다임인 시맨틱 웹이 대두되고 있다. 시맨틱 웹은 온톨로지를 기반으로 인간과 기계가 이해할 수 있는 기법을 프로그램화 시켜서 웹에 적용시키고자 하는 것을 목적으로 한다.
  • 그래서 현재의 웹 문서뿐만 아니라 공공 문서 등에 XML을 이용하여 표준화 작업이 진행 중이기 때문에 XML 문서가 증가하고 있으며, XML은 메타 데이터를 표현해서 풍부한 정보를 전달 해 주는 장점이 있다, 따라서 이 논문에서는 이러한 XML 문서를 기반으로 데이터 마이닝 기법을 이용하여 시맨틱 웹의 기반인 온톨로지를 구축하는 방법을 제안하였다. 온톨로지를 수동으로 구축하는 경우 비용과 시간이 낭비되는 문제가 발생하여 비효율적이므로, 이러한 단점을 해결하기 위해서 온톨로지 구축의 반자동화 방식을 제안하였다. 즉, 특정한 도메인 내의 온톨로지를 구축하기 위해서 어떠한 타입, 그리고 얼마나 많은 개념을 사용할 것인가 하는 문제를 해결하기 위해서 데이터 마이닝을 이용하였다.
  • 토픽맵의 토픽들은 비슷한 유형끼리 분류한 토픽 타입과 상하관계와 상속관계가 존재한다[23]. 이 논문에서는 온톨로지 생성 도메인을 관광정보로 제한하며, 온톨로지를 생성하기 위하여 지역, 관광지, 숙박시설, 교통시설, 토속음식, 관광 상품 등을 토픽타입과 토픽으로 정의한다.
  • 제 3장에서는 이 논문의 데이터로 사용하고 있는 XML 문서에 대하여 연관 규칙 알고리즘을 적용하는 방법 및 온 톨로 지의 도메인 레벨을 생성하는 과정에 대해서 알아본다. 4장에서는 XTM과 공개 소스인 토픽맵 엔진 TM4J를 이용한 온톨로지 자동 구축에 대해서 알아본다. 제 5장에서는 제안시스템의 구현 환경과 연관규칙 알고리즘을 적용하여 온톨로지의 도메인 레벨의 생성 과정에 대한 실험 평가를 제시한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (28)

  1. T.R.Gruber, 'Toward principles for the design of ontologies used for knowledge sharing', Int. J.Human Computer Studies, Vol.43, pp.907-928, 1995 

  2. M.Ushold, M.Gruninger, 'Ontologies: principles, methods and applications', The Knowledge Engineering Review, Vol.11, No.2, pp.93-136, 1996 

  3. S. Staab, H. P. Schnurr, R. Studer, Y. Sure, 'Knowledge processes and ontologies', IEEE Intelligent Systems, Special Issue on Knowledge Management, Vol.16 No.1, pp.26-34, 2001 

  4. Steve Pepper, 'The TAO of Topic Maps', XML Conference & Exposition, 2000 

  5. S. Pepper, B. Moore, 'XML Topic Maps(XTM) 1.0', TopicMaps.Org 

  6. Koung-lung Lin, Yen-jen Oyang, 'Knowledge Management for a Buddhism Digital Archive with Topic Map', ICDAT 2002, pp.91-101, 2002 

  7. D. Braga, A. Campi, S. Ceri, M. Klemettinen, P. Lanzi, 'Discovering interesting information in XML data with association rules', SAC, Proceedings of the 2003 ACM symposium on Applied computing table of contents, pp.450-454, 2003 

  8. R. Agrawal, T. Imielinski, A. N. Swami, 'Mining association roles between set of items in large database', Proceedings of ACM SIGMOD Conference on Management of Data(SIGMOD '93), pp.207-216, 1993 

  9. R. Agrawl, R. Srikant, 'Fast Algorithms for Mining Association Rules', Proceedings of the VLDB, pp.487-499, Santiago de Chile, Chile, September, 1994 

  10. D. Braga, A. Campi, S. Ceri, M. Klemettinen, PL. Lanzi, 'A Tool for Extracting XML Association Rules from XML Documents', in Proceedings of IEEE-ICTAI 2002, pp.57-64, Washington DC, USA, November, 2002 

  11. Q. Ding, K. Ricords, J. Lumpkin, 'Deriving General Association Rules from XML Data', DBLP:conf/snpd/2003 pp.348-352. 2003 

  12. A. Termier, M-C. Rousset, M. Sebag, 'TreeFinder: a Fast Step towards XML Data Mining', In Proceedings of the 2002 IEEE International Conference on Data Mining (ICDM 2002), pp.450-457, 2002 

  13. A. Maedche, S. Staab, 'Discovering Conceptual Relations from Text', Technical Report 399, Institute AIFB, Karlsruhe University, 2000 

  14. A. Maedche, S. Staab, 'Semi-Automatic Engineering of Ontologies from Text', Proceedings of the 12th International Conference on Software Engineering and Knowledge Engineering, 2000 

  15. R. Srikant, R. Agrawal, 'Mining Generalized Association Rules', In Proc. of VLDB '95, pp.407-419, 1995 

  16. http://www.cs.toronto.edu/tox/toxgene/index.html 

  17. http://www.cogsci.princeton.edu/~wn/wn2.0 

  18. http://www.ontopia.net 

  19. http://www.hibernate.org 

  20. Jacky W. W. Wan, G. Dobbie, 'Mining Association Rules from XML Data using XQuery', ACM International Conference Proceeding, Vol.54, 2004 

  21. 이정원, 방건동, 박세형, 백두권 '온톨로지 기반 설계 문서 관리 시스템 설계 및 구현,' 한국정보 과학회, 제 28권, 1호, pp.79-81, 2001 

  22. 김정민, 박철만, 정준원, 이한준, 정호영, 민경섭, 김형주, 'K-Box: 토픽맵 기반의 온톨로지 관리 시스템', 정보과학회 춘계학술대회, Vol.10, No.1, pp1-13, 2004 

  23. 김정민, 박철만, 정준원, 이한준, 정호영, 민경섭, 김형주, '온톨로지 기반의 지식맵 서비스 시스템의 설계 및 구현', 한국정보과학회 학술발표논문집, 제30권 제1호(A) pp.527-529, 2003 

  24. 정호영, 김정민. 정준원, 김형주, 'XTM 기반의 지식맵', 데이터베이스연구회 학회지 Vol.19, No.01, pp.0038-0047, 2003 

  25. 오장근, '유로워드넷 기반의 어휘 데이터베이스 활용을 위한 한국어-독일어 ILI 대응 방법론 연구', 한국독일어문학회 추계 학술대회, 2002 

  26. 박명제, 민준기, 윤정희, 안재용, 정진완, '관계 형 데이터베이스와 XQuery를 이용한 XML 문서의 저장 및 검색 시스템', SIGDB-KISS Vol.18, No.02, 2002 

  27. 장형화, 홍의경, '관계 데이터베이스 시스템 기반의 XQuery 질의 처리기 설계', 정보과학회 추계 학술대회 Vol.30, No.2-2, pp.0106-0108, 2003 

  28. 최규원, 정채영, 김영옥, 김영균, 강현석, 배종민, '관계형 데이터베이스에서 XML 뷰 기반의 질의 처리 모델', 한국정보처리학회 논문지 Vol.10, No.02, pp.0221-0232, 2003 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로