최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법의 연관규칙알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.
최근 웹 문서를 비롯한 공공 문서 등에 대한 문서 교환을 위해 XML 데이터를 이용한 표준화 작업이 진행 중이므로 XML 문서가 증가하고 있다. 이와 같은 XML 문서에 대한 정보 검색의 효율을 높이기 위해 의미적 요소를 추가한 온톨로지를 기반으로 하는 시맨틱 웹이 등장하였다. 그러나 기존의 수동적인 온톨로지 구축 방식은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합으로부터 데이터 마이닝 기법의 연관규칙 알고리즘을 이용하여 반자동으로 온톨로지를 구축하는 방법을 제안한다. 제안한 방법은 특정한 도메인에 대한 온톨로지를 구축하기 위해서 필요한 데이터의 형태 및 개념 레벨, 그리고 얼마나 많은 개념을 사용할 것인가 하는 도메인 범위의 자동 설정을 온톨로지 자동 생성을 위한 온톨로지 도메인 레벨을 결정하기 위해서 데이터 마이닝 알고리즘을 이용한다. XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내고, 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성을 위한 도메인 범위를 설정한다. 온톨로지 구축은 온톨로지 언어중의 하나인 XML Topic Maps와 공개 소스인 토픽법 엔진인 TM4J를 이용하여 온톨로지 기반의 시맨틱 웹 엔진을 구현하였다.
As recently XML is becoming the standard of exchanging web documents and public documentations, XML data are increasing in many areas. To retrieve the information about XML documents efficiently, the semantic web based on the ontology is appearing. The existing ontology has been constructed manually...
As recently XML is becoming the standard of exchanging web documents and public documentations, XML data are increasing in many areas. To retrieve the information about XML documents efficiently, the semantic web based on the ontology is appearing. The existing ontology has been constructed manually and it was time and cost consuming. Therefore in this paper, we propose the semi-automatic ontology generation technique using the data mining technique, the association rules. The proposed method solves what type and how many conceptual relationships and determines the ontology domain level for the automatic ontology generation, using the data mining algorithm. Appying the association rules to the XML documents, we intend to find out the conceptual relationships to construct the ontology, finding the frequent patterns of XML tags in the XML documents. Using the conceptual ontology domain level extracted from the data mining, we implemented the semantic web based on the ontology by XML Topic Maps (XTM) and the topic map engine, TM4J.
As recently XML is becoming the standard of exchanging web documents and public documentations, XML data are increasing in many areas. To retrieve the information about XML documents efficiently, the semantic web based on the ontology is appearing. The existing ontology has been constructed manually and it was time and cost consuming. Therefore in this paper, we propose the semi-automatic ontology generation technique using the data mining technique, the association rules. The proposed method solves what type and how many conceptual relationships and determines the ontology domain level for the automatic ontology generation, using the data mining algorithm. Appying the association rules to the XML documents, we intend to find out the conceptual relationships to construct the ontology, finding the frequent patterns of XML tags in the XML documents. Using the conceptual ontology domain level extracted from the data mining, we implemented the semantic web based on the ontology by XML Topic Maps (XTM) and the topic map engine, TM4J.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
관광관련 사이트에 사용자들로부터 자주 발생하는, "제주도에 있는 용두암을 여행할 때 적절한 숙박 시설을 검색하시오., , 와 같은 질의에서, “용두암”은 “관광지이름, , 중의 하나이고, 호텔”은, , 숙박시설”중의 하나이다.
많이 소요된다. 그러므로 이 논문에서는 데이터 마이닝 기법을 이용한 반자동 온톨로지 생성 기법을 제안하며, 이 기법은 사용자의 특정 도메인 내의 정보검색에 대하여 사용자에게 효율적인 정보를 제공하는데 도움을 준다.
온톨로지 구축 방법의 연구가 필요하다. 그러므로 이 논문에서는 현재 웹 데이터의 표준인 XML 문서로부터 온톨로지를 생성하는 방법을 제안한다.
생성되면 파싱을 수행하게 된다. 그리고 온톨로지 기반토픽맵 엔진의 처리 과정을 수행하여 온톨로지 데이터베이스에 저장되며, 사용자 인터페이스를 통해서 사용자의 질의에 알맞은 검색 결과를 제시해 준다.
현재의 웹에 의미정보를 추가하여 정보 검색에 효율성을 기하기 위해 새로운 패러다임인 시맨틱 웹이 대두되고 있다. 시맨틱 웹은 온톨로지를 기반으로 인간과 기계가 이해할 수 있는 기법을 프로그램화 시켜서 웹에 적용시키고자 하는 것을 목적으로 한다.
그래서 현재의 웹 문서뿐만 아니라 공공 문서 등에 XML을 이용하여 표준화 작업이 진행 중이기 때문에 XML 문서가 증가하고 있으며, XML은 메타 데이터를 표현해서 풍부한 정보를 전달 해 주는 장점이 있다, 따라서 이 논문에서는 이러한 XML 문서를 기반으로 데이터 마이닝 기법을 이용하여 시맨틱 웹의 기반인 온톨로지를 구축하는 방법을 제안하였다. 온톨로지를 수동으로 구축하는 경우 비용과 시간이 낭비되는 문제가 발생하여 비효율적이므로, 이러한 단점을 해결하기 위해서 온톨로지 구축의 반자동화 방식을 제안하였다. 즉, 특정한 도메인 내의 온톨로지를 구축하기 위해서 어떠한 타입, 그리고 얼마나 많은 개념을 사용할 것인가 하는 문제를 해결하기 위해서 데이터 마이닝을 이용하였다.
토픽맵의 토픽들은 비슷한 유형끼리 분류한 토픽 타입과 상하관계와 상속관계가 존재한다[23]. 이 논문에서는 온톨로지 생성 도메인을 관광정보로 제한하며, 온톨로지를 생성하기 위하여 지역, 관광지, 숙박시설, 교통시설, 토속음식, 관광 상품 등을 토픽타입과 토픽으로 정의한다.
제 3장에서는 이 논문의 데이터로 사용하고 있는 XML 문서에 대하여 연관 규칙 알고리즘을 적용하는 방법 및 온 톨로 지의 도메인 레벨을 생성하는 과정에 대해서 알아본다. 제 4장에서는 XTM과 공개 소스인 토픽맵 엔진 TM4J를 이용한 온톨로지 자동 구축에 대해서 알아본다. 제 5장에서는 제안시스템의 구현 환경과 연관규칙 알고리즘을 적용하여 온톨로지의 도메인 레벨의 생성 과정에 대한 실험 평가를 제시한다.
제안 방법
XML 문서에 데이터 마이닝 알고리즘을 적용하여, XML 문서의 특징과 태그를 기반으로 조인 과정을 통해서 태그의 빈발 패턴을 찾아내어 서로의 연관성에 대해 사용자의 질의에 적합한 온톨로지를 구축하여 검색 결과를 제시한다. 예를 들어, "제주도에 있는 용두암을 여행할 때 적절한 숙박시설을 검색하시오”라는 사용자의 질의를 가정하고, 사용자질의에 대해서 XML 문서의 태그인 다음의 관계를 보자.
XML 문서에서 서로 관련 있는 용어와 속성 값을 추출해내기 위해, 관광 정보를 취급하는 사이트로부터 문서 집합을 추출한다. 각각은 관광 정보인 관광지, 숙박시설, 국내, 국외, 교통시설 등의 정보를 XML 문서로 전환한 문서 집합으로 이루어져 있다.
XML 문서의 태그에 대한 빈발 패턴을 찾아내어 연관 관계를 맺어주는 연관 규칙을 수행하여 온톨로지의 도메인을 생성한다. 다음 (그림 2)는 온톨로지 구축을 위한 도메인으로 설정한 관광 정보에 관한 내용을 XML로 전환한 문서의 일부분을 보여주고 있으며, tour_info를 루트 태그로 해서 지역, 관광지, 숙박시설 등의 서브 태그 구조를 가지고 있다.
XML 문서의 태그에 대해 연관규칙을 적용하여 빈발하게 발생하는 빈발 패턴을 찾아내어 서로 관련 있는 개념의 쌍을 추출하여 온톨로지 자동 생성의 기반을 마련하여 온톨로지를 구축하였다. 이와 같은 빈발 태그를 온톨로지 언어 중의 하나인 XML Topic Maps를 이용하여 온톨로지를 구축하였고, 공개 소스인 토픽맵 엔진인 TM4J를 이용하여 온톨로지를 자동 구축한 시맨틱 웹 엔진을 구현하였다.
그래서 현재의 웹 문서뿐만 아니라 공공 문서 등에 XML을 이용하여 표준화 작업이 진행 중이기 때문에 XML 문서가 증가하고 있으며, XML은 메타 데이터를 표현해서 풍부한 정보를 전달 해 주는 장점이 있다, 따라서 이 논문에서는 이러한 XML 문서를 기반으로 데이터 마이닝 기법을 이용하여 시맨틱 웹의 기반인 온톨로지를 구축하는 방법을 제안하였다. 온톨로지를 수동으로 구축하는 경우 비용과 시간이 낭비되는 문제가 발생하여 비효율적이므로, 이러한 단점을 해결하기 위해서 온톨로지 구축의 반자동화 방식을 제안하였다.
그러나 이 논문에서는 온톨로지 구축을 위한 도메인을 자동으로 결정하기 위해서 웹상의 데이터 중에서 연관성이 있는 데이터들을 대상으로 연관규칙 알고리즘을 적용하였고, 이를 통해 찾아진 결과들을 이용하여 온톨로지를 자동으로 구축하였다. 그러므로 이 논문에서 제안하는 온톨로지 기반의 정보 검색 시스템은 기존의 온톨로지 구축과정에서 도메인 설계에 소요되는 시간을 상당히 줄일 수 있다는 장점이 있다.
XTM 으로 작성된 토픽맵 소스, 기존의 토픽맵 파일, 토픽맵 빌더 (TopicMapBuilder)에 의해서 생성된 문서등이, 토픽맵 프로바이더 (TopicMapProvider)에 의해서 로케이터 팩토리(LocatorFactory)로 제공되면, 로케이터 (Locator)가 만들어진다. 그리고 토픽맵 프로바이터 팩토리 (TopicMapProvider Factory)가 토픽맵 프로바이더 (TopicMapProvider)를 만들어서 토픽맵을 생성한다. 이렇게 생성된 토픽맵은 토픽 맵 팩토리에 제공되고, 인덱스 매니저에 제공되어 인덱스를 생성한다.
기존의 수동적인 온톨로지 구축방법은 비용과 시간이 많이 소모되는 단점이 있으므로 이 논문에서는 유사한 도메인의 XML문서 집합에 대한 데이터 마이닝 알고리즘을 이용하여 반자동의 온톨로지를 구축하는 방법을 제안한다.
셋째, 관광 정보로 만들어진 XML 문서를 구성하고 있는 약 250B개의 태그를 추출한다. 넷째, 관광정보 사이트를 통해서 찾아낸 정보로 이루어진 XML 문서에서 추출해낸 태그에 대해서, 같은 의미를 나타내는 유사한 표현을 사용하는 태그 명을 찾기 위해 WordNet (http:〃www.cogsci.princeton.edu/~wn/wn2.0)을 이용하여 처리한다[17, 25], 다섯째, XML 문서의 태그를 추출하여 연관규칙 알고리즘을 수행하기 위해서는 각 태그에 번호를 매겨서 매핑 테이블을 만들어 프로그램을 실행한다.
, , 와 같은 질의에서, “용두암”은 “관광지이름, , 중의 하나이고, 호텔”은, , 숙박시설”중의 하나이다. 데이터베이스에 저장된 XML 문서에 대해서 사용자의 질의를 기반으로 서로 관련된 개념간의 연관관계를 찾아낸다.
과정을 수행한다. 둘째, XML 문서에 대해서 Dom Parser 를 이용하여 파싱을 한다. 셋째, 관광 정보로 만들어진 XML 문서를 구성하고 있는 약 250B개의 태그를 추출한다.
실험은 적절한 임계 값 설정을 위해 먼저 최소 지지도 변화에 따른 빈발 항목과 실행시간의 변화에 대해서 알아본다. 최소 지지도의 값은 절대 지지도와 상대 지지도로 나누어서 실험을 하였고 다음으로는 최소 신뢰도와 세 가지의 최소 지지도 값에 따라서 각각 생성되는 연관규칙의 개수의 변화과정에 대해서 비교 설명한다.
온톨로지 구축을 위해 사용할 데이터인 웹의 관광정보 사이트를 통해서 찾아낸 관광정보들에 대하여 데이터 마이닝을 하기 위한 전 처리 과정에 대해서 알아본다.
온톨로지 도메인 레벨을 생성하기 위해서, XML 문서의 태그를 이용하여 일반화된 형태의 계층구조를 만들어 낸다. 이 계층구조를 이용해서 온톨로지를 생성하고자 할 때, 대량의 데이터로 인해서 비용과 시간 면에서 비효율적이기 때문어】, 온톨로지 구축을 위한 도메인 레벨을 위한 데이터 마이닝 기법인 연관규칙을 이용한다.
온톨로지를 이용한 검색 엔진은 J2SDK L4.2(Java)와 공개 소스인 온토피아사의 토픽맵 엔진인 TM4J(Topic Map for JAVA)-0.9.6을 이용 하였고, 검색 인터페이스는 JSP와 HTML을 사용하여 구현하였다. 그리고 XML 데이터와 온톨로지 데이터의 저장, 관리를 위한 DBMS는 Oracle9i를 이용하였고, Java 컨테이너로 Tomcat 5.
이 논문에서 제안하는 온톨로지를 구성하는 토픽맵 모델의 기본 요소는 토픽, 연관 관계, 어커런스 등으로 구성된다[4, 5].
관광지 정보, 숙박시설 정보, 교통 정보를 가지고 있는 문서가 연관규칙에 적용시킬 수 있는 하나의 트랜잭션이 된다. 이와 같은 각 문서 단위의 트랜잭션이 가지고 있는 태그를 항목으로 구성하며, 구성된 항목은 그 문서 내에서 발생 빈도를 계산한다.
구축하였다. 이와 같은 빈발 태그를 온톨로지 언어 중의 하나인 XML Topic Maps를 이용하여 온톨로지를 구축하였고, 공개 소스인 토픽맵 엔진인 TM4J를 이용하여 온톨로지를 자동 구축한 시맨틱 웹 엔진을 구현하였다. 온톨로지 기반의 시맨틱 웹 정보 검색 기법은, 기존의 웹 시스템에 의미적인 요소를 추가하여 사람과 기계가 이해할 수 있는 있는 방식을 구현하여, 시맨틱 적인 요소를 추가하므로써 사용자의 정보 검색 요구에 정확한 정보를 제공할 수 있다.
확인할 수 있다. 이와 같은 빈발 패턴에 대한 연관 쌍을 추출하는 연관규칙 알고리즘을 반복해서 수행하여 빈발 패턴을 찾아낸다. 그리고 이 과정에서 함께 추출된 항목이 포함관계에 있는 경우에는 좀 더 일반화된 태그를 선택하여온 톨로지 도메인 레벨을 생성하는데 사용한다.
온톨로지를 수동으로 구축하는 경우 비용과 시간이 낭비되는 문제가 발생하여 비효율적이므로, 이러한 단점을 해결하기 위해서 온톨로지 구축의 반자동화 방식을 제안하였다. 즉, 특정한 도메인 내의 온톨로지를 구축하기 위해서 어떠한 타입, 그리고 얼마나 많은 개념을 사용할 것인가 하는 문제를 해결하기 위해서 데이터 마이닝을 이용하였다.
첫째, 웹에 있는 관광 정보 사이트를 대상으로 관광 정보를 찾아내어 XML 제너레이터를 이용하여, XML 문서로 전환하는 과정을 수행한다. 둘째, XML 문서에 대해서 Dom Parser 를 이용하여 파싱을 한다.
최소 지지도의 값은 절대 지지도와 상대 지지도로 나누어서 실험을 하였고 다음으로는 최소 신뢰도와 세 가지의 최소 지지도 값에 따라서 각각 생성되는 연관규칙의 개수의 변화과정에 대해서 비교 설명한다.
개념간의 관계를 찾을 뿐 아니라, 관계를 정의할 수 있는 적절한 추상화된 레벨를결정하기 위해 일반화된 연관 규칙을 사용한다. 특정한 온톨로지 내에서, 개념 관계를 얼마나 많이 그리고 어떠한 타입으로 모델링 할 것인가에 대하여, 텍스트 데이터를 기반으로 일반화된 연관 규칙을 적용하여 개념관계를 필터링 하는 과정을 수행하였다.
대상 데이터
둘째, XML 문서에 대해서 Dom Parser 를 이용하여 파싱을 한다. 셋째, 관광 정보로 만들어진 XML 문서를 구성하고 있는 약 250B개의 태그를 추출한다. 넷째, 관광정보 사이트를 통해서 찾아낸 정보로 이루어진 XML 문서에서 추출해낸 태그에 대해서, 같은 의미를 나타내는 유사한 표현을 사용하는 태그 명을 찾기 위해 WordNet (http:〃www.
발생하는 빈발 패턴을 찾아낸다. 이 논문의 데이터는 웹에 있는 관광에 대한 정보를 제공하는 사이트를 통해서 관광 관련 자료를 Xgenerator[16] 라는 문서 변환기를 이용하여 XML 문서로 전환하는 과정을 수행한 XML 문서를 이용하였다.
소개한다. 이 실험은 웹 사이트를 통해서 가져온 관광 정보들을 XML 문서로 변환 과정을 수행하여 관계형 데이터베이스에 저장된 XML문서의 태그의 수가 2, 500개로 이루어진 데이터를 기반으로 실험한다. 데이터베이스에 저장된 훈련데이터 집합 중에서 관광지 정보에 대한 테이블 스키마는 다음과 같다.
이론/모형
XML 문서내의 태그로 이루어진 일반화된 계층구조를 이용하여, 연관규칙 알고리즘을 적용한다. 관광지 정보, 숙박시설 정보, 교통 정보를 가지고 있는 문서가 연관규칙에 적용시킬 수 있는 하나의 트랜잭션이 된다.
사용자에 의해서 정보 검색 질의가 제기 되었을 때, XPath 를 기반으로 XQuery의 신택스 구죄20, 26-28]를 이용하여 XML 문서에 대한 연관 규칙 알고리즘을 적용하여 데이터마이닝을 수행한다. (그림 9)는 앞에서 제시한 질의를 XQuery를 이용한 것이다.
아키텍쳐를 제시하고 있다. 이 아키텍쳐를 기반으로, 반자동화된 택소노미(Taxonomy) 구조를 만들어 내는데, 개념 간의 관계를 찾을 뿐 아니라, 관계를 정의할 수 있는 적절한 추상화된 레벨을 결정하기 위해서 일반화된 연관 규칙을 사용한다. 이 알고리즘은 조상 노드를 포함시켜서 계층구조 생성을 위한 추상화 레벨을 일반화 시켜가는 과정으로 전개된다.
어커런스는 문서파일, 이미지 파일, 데이터베이스 내 특정 레코드 등의 형태가 된다. 토픽맵의 토픽들은 자신의 자원을 가리키기 위해 하이타임(HyTime), 엑스 포인터(Xpointer) 기법을 사용한다. 토픽맵과 실제 지식 자원 사이를 분리할 수 있는 것은 실제 지식 항목의 이동 없이 토픽맵 만으로 지식 항목을 분류하는 색인 기능을 제공한다[24].
성능/효과
이것은 사용자가 원하는 검색과 더불어 필요하지 않은 정보까지 제공하게 되므로 사용자가 다시 정보를 걸러내야 하는 어려움이 있었다. 그러나 이 논문에서 제안한 시스템은 온톨로지를 기반으로 하는 계층구조의 키워드 메뉴를 이용하며, 사용자가 원하는 정보와 연관된 정보들만을 신속하고 정확하게 제공할 수 있다는 특징이 있다.
그러나 이 논문에서는 온톨로지 구축을 위한 도메인을 자동으로 결정하기 위해서 웹상의 데이터 중에서 연관성이 있는 데이터들을 대상으로 연관규칙 알고리즘을 적용하였고, 이를 통해 찾아진 결과들을 이용하여 온톨로지를 자동으로 구축하였다. 그러므로 이 논문에서 제안하는 온톨로지 기반의 정보 검색 시스템은 기존의 온톨로지 구축과정에서 도메인 설계에 소요되는 시간을 상당히 줄일 수 있다는 장점이 있다. 또한 사용자의 검색과정에서도 사용자가 원하는 정보를 빠르고 정확하게 제공할 수 있다는 장점을 제공한다.
조상 태그에 포함 되므로 제거된다. 둘째, (호텔이름, 호텔)과 (민박, 주소) 쌍은 신뢰도와 지지도가 낮기 때문에 제거된다.
그러므로 이 논문에서 제안하는 온톨로지 기반의 정보 검색 시스템은 기존의 온톨로지 구축과정에서 도메인 설계에 소요되는 시간을 상당히 줄일 수 있다는 장점이 있다. 또한 사용자의 검색과정에서도 사용자가 원하는 정보를 빠르고 정확하게 제공할 수 있다는 장점을 제공한다. 예를 들어 기존의 검색 시스템은 “제주도에 있는 숙박 시설” 을 키워드로 검색할 경우, 키워드인 "제주도와 관련된 사이트들과 "숙박시설”과 연관 있는 다양한 사이트들을 모두 디스플레이 해준다.
첫째, (제주도, 관광지이름)이라는 개념관계의 쌍에 대한 상위 관계의 개념인 (국내, 지역)의 쌍이 빈발 패턴으로 있기 때문에, 그 자식 관계에 있는 개념 쌍은 좀 더 일반화된 태그인 조상 태그에 포함 되므로 제거된다. 둘째, (호텔이름, 호텔)과 (민박, 주소) 쌍은 신뢰도와 지지도가 낮기 때문에 제거된다.
후속연구
그리고 이 논문에서 제안한 시맨틱 웹을 이용한 정보검색 시스템과 다른 시스템과의 성능비교를 계속 할 것이며, 또한 이 논문에서 제시한 정보검색 시스템의 재현율(recall)과 적합율 (precision)에 대해 제시하여 사용자에게 어느 정도의 정확한 정보를 줄 수 있는가에 대한 연구를 계속 할 것이다.
앞으로는 다양한 데이터 마이닝 기법을 적용하여 다양한 분야에 대한 온톨로지의 자동 구축과, RDF(S), OWL, DAML 등의 다양한 온톨로지 언어를 적용하는 연구가 필요하다. 그리고 이 논문에서 제안한 시맨틱 웹을 이용한 정보검색 시스템과 다른 시스템과의 성능비교를 계속 할 것이며, 또한 이 논문에서 제시한 정보검색 시스템의 재현율(recall)과 적합율 (precision)에 대해 제시하여 사용자에게 어느 정도의 정확한 정보를 줄 수 있는가에 대한 연구를 계속 할 것이다.
참고문헌 (28)
T.R.Gruber, 'Toward principles for the design of ontologies used for knowledge sharing', Int. J.Human Computer Studies, Vol.43, pp.907-928, 1995
S. Staab, H. P. Schnurr, R. Studer, Y. Sure, 'Knowledge processes and ontologies', IEEE Intelligent Systems, Special Issue on Knowledge Management, Vol.16 No.1, pp.26-34, 2001
Steve Pepper, 'The TAO of Topic Maps', XML Conference & Exposition, 2000
S. Pepper, B. Moore, 'XML Topic Maps(XTM) 1.0', TopicMaps.Org
Koung-lung Lin, Yen-jen Oyang, 'Knowledge Management for a Buddhism Digital Archive with Topic Map', ICDAT 2002, pp.91-101, 2002
D. Braga, A. Campi, S. Ceri, M. Klemettinen, P. Lanzi, 'Discovering interesting information in XML data with association rules', SAC, Proceedings of the 2003 ACM symposium on Applied computing table of contents, pp.450-454, 2003
R. Agrawal, T. Imielinski, A. N. Swami, 'Mining association roles between set of items in large database', Proceedings of ACM SIGMOD Conference on Management of Data(SIGMOD '93), pp.207-216, 1993
R. Agrawl, R. Srikant, 'Fast Algorithms for Mining Association Rules', Proceedings of the VLDB, pp.487-499, Santiago de Chile, Chile, September, 1994
D. Braga, A. Campi, S. Ceri, M. Klemettinen, PL. Lanzi, 'A Tool for Extracting XML Association Rules from XML Documents', in Proceedings of IEEE-ICTAI 2002, pp.57-64, Washington DC, USA, November, 2002
Q. Ding, K. Ricords, J. Lumpkin, 'Deriving General Association Rules from XML Data', DBLP:conf/snpd/2003 pp.348-352. 2003
A. Termier, M-C. Rousset, M. Sebag, 'TreeFinder: a Fast Step towards XML Data Mining', In Proceedings of the 2002 IEEE International Conference on Data Mining (ICDM 2002), pp.450-457, 2002
A. Maedche, S. Staab, 'Discovering Conceptual Relations from Text', Technical Report 399, Institute AIFB, Karlsruhe University, 2000
A. Maedche, S. Staab, 'Semi-Automatic Engineering of Ontologies from Text', Proceedings of the 12th International Conference on Software Engineering and Knowledge Engineering, 2000
R. Srikant, R. Agrawal, 'Mining Generalized Association Rules', In Proc. of VLDB '95, pp.407-419, 1995
http://www.cs.toronto.edu/tox/toxgene/index.html
http://www.cogsci.princeton.edu/~wn/wn2.0
http://www.ontopia.net
http://www.hibernate.org
Jacky W. W. Wan, G. Dobbie, 'Mining Association Rules from XML Data using XQuery', ACM International Conference Proceeding, Vol.54, 2004
이정원, 방건동, 박세형, 백두권 '온톨로지 기반 설계 문서 관리 시스템 설계 및 구현,' 한국정보 과학회, 제 28권, 1호, pp.79-81, 2001
김정민, 박철만, 정준원, 이한준, 정호영, 민경섭, 김형주, 'K-Box: 토픽맵 기반의 온톨로지 관리 시스템', 정보과학회 춘계학술대회, Vol.10, No.1, pp1-13, 2004
※ AI-Helper는 부적절한 답변을 할 수 있습니다.