시맨틱 웹은 단순한 문서들의 링크가 아닌 문서들의 의미와 관계를 표현하는 웹으로 소프트웨어 에이전트가 이해할 수 있도록 구성되어 있다 본 논문에서 제안하는 검색방식은 온톨로지기반의 추론을 통한 시맨틱 검색방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다. 둘째, 규칙기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치(exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다. 셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것 보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적으로 찾게 한다. 이러한 방식은 데이타베이스의 질의문을 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 검색 시스템보다 정화한 검색을 가능하게 한다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시맨틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다.
시맨틱 웹은 단순한 문서들의 링크가 아닌 문서들의 의미와 관계를 표현하는 웹으로 소프트웨어 에이전트가 이해할 수 있도록 구성되어 있다 본 논문에서 제안하는 검색방식은 온톨로지기반의 추론을 통한 시맨틱 검색방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다. 둘째, 규칙기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치(exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다. 셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것 보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적으로 찾게 한다. 이러한 방식은 데이타베이스의 질의문을 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 검색 시스템보다 정화한 검색을 가능하게 한다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시맨틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다.
The semantic web is the web paradigm that represents not general link of documents but semantics and relation of document. In addition it enables software agents to understand semantics of documents. We propose a semantic search based on inference with ontologies, which has the following characteris...
The semantic web is the web paradigm that represents not general link of documents but semantics and relation of document. In addition it enables software agents to understand semantics of documents. We propose a semantic search based on inference with ontologies, which has the following characteristics. First, our search engine enables retrieval using explicit ontologies to reason though a search keyword is different from that of documents. Second, although the concept of two ontologies does not match exactly, can be found out similar results from a rule based translator and ontological reasoning. Third, our approach enables search engine to increase accuracy and precision by using explicit ontologies to reason about meanings of documents rather than guessing meanings of documents just by keyword. Fourth, domain ontology enables users to use more detailed queries based on ontology-based automated query generator that has search area and accuracy similar to NLP. Fifth, it enables agents to do automated search not only documents with keyword but also user-preferable information and knowledge from ontologies. It can perform search more accurately than current retrieval systems which use query to databases or keyword matching. We demonstrate our system, which use ontologies and inference based on explicit ontologies, can perform better than keyword matching approach .
The semantic web is the web paradigm that represents not general link of documents but semantics and relation of document. In addition it enables software agents to understand semantics of documents. We propose a semantic search based on inference with ontologies, which has the following characteristics. First, our search engine enables retrieval using explicit ontologies to reason though a search keyword is different from that of documents. Second, although the concept of two ontologies does not match exactly, can be found out similar results from a rule based translator and ontological reasoning. Third, our approach enables search engine to increase accuracy and precision by using explicit ontologies to reason about meanings of documents rather than guessing meanings of documents just by keyword. Fourth, domain ontology enables users to use more detailed queries based on ontology-based automated query generator that has search area and accuracy similar to NLP. Fifth, it enables agents to do automated search not only documents with keyword but also user-preferable information and knowledge from ontologies. It can perform search more accurately than current retrieval systems which use query to databases or keyword matching. We demonstrate our system, which use ontologies and inference based on explicit ontologies, can perform better than keyword matching approach .
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 사용자의 입력 질의문에서 정확하게 매칭되는 부분이 지식베이스에 없을 경우에 시맨틱 질 의문을 생성하여 시맨틱 검색을 수행하는 시맨틱 검색 메커니즘을 제안한다. 본 논문에서는 시맨틱 검색을 수행하기 위해서 두 단계의 검색 방법을 거친다.
본 논문에서는 시맨틱 검색을 수행하기 위한 시맨틱 검색 메커니즘에 대해 제안한다. 앞서 언급한 시맨틱 질 의문을 생성한 후에는 시맨틱 검색 알고리즘에 따라서 검색을 수행한다.
본 논문에서는 사용자의 입력 질의문에서 정확하게 매칭되는 부분이 지식베이스에 없을 경우에 시맨틱 질 의문을 생성하여 시맨틱 검색을 수행하는 시맨틱 검색 메커니즘을 제안한다. 본 논문에서는 시맨틱 검색을 수행하기 위해서 두 단계의 검색 방법을 거친다. 첫 번째는 온톨로지 기반의 다이렉트 검색 방법으로 사용자의 질의문과 메타데이타의 속성이 정확하게 매칭되는 부분을 검색하는 방법이다.
그리고 본 논문에서 제안하는 시스템의 각 구성 별로 트리 플 변환기, 시맨틱 추론 엔진, 질의문 처리기를 포함하는 사용자 인터페이스를 구현하였다. 본 논문에서는 시맨틱 검색을 실험하기 위하여 웹 기반으로 시맨틱 검색 시스템을 구현하였다. 본 논문의 시팬틱 검색 시스템에서 사용자는 원하는 검색 키워드 정보를 온톨로지를 기반으로 메뉴 형식으로 표현되는 검색 콤보박스에서 쉽게 도메인 정보를 선택해서 검색을 수행할 수 있다.
본 논문은 食 과적인 검색시스템의 구축을 위해 서술 논리(Description Logic) 바탕의 온톨로지를 사용하여 메 타데이타를 생성하고 추론 엔진을 접목시켜 온톨로지의 계층구조와 규칙, 공리(axiom)를 사용하여 추론을 함으로써, 기존의 지식베이스에 없는 지식을 검색영역에 포함하므로 모호한 질의에 대하여 해당하는 문서의 검색이 가능한 시맨틱 검색을 사용하는 방법을 제안하였다. 먼저 본 논문에서 제안하는 정보 검색시스템의 전체적인 구조를 살펴보고 세부적인 부분을 언급하여 설명하도록 한다.
본 논문은 시맨틱 웹 환경에서의 검색 기법을 제안하였다. 본 검색 시스템은 온톨로지의 공리를 충분히 고려 한검색 시스템으로 기존의 온톨로지만 의 계층 구조를 이용하는 검색 방법보다 효율성을 높일 수 있었고 정확한 매칭의 한계를 보완하는 검색 방법으로 시맨틱 검색기법을 제안하였다.
이러한 추론 검색방식은 질의문을 온 톨 로지를 기반으로 확장시키는 형태로써 키워드가 달라 도 의미적으로 유사한 컨셉을 찾아주게 된다. 본 논문은 실제 도메인 온톨로지를 작성하여 이를 기반으로 검색 시스템에서 사용자로 하여금 쉽게 복잡한 질의문에 해당하는 검색 결과를 얻게 하고 정확한 매칭으로 찾을 수 없는 결과를 온톨로지 추론으로 얻을 수 있게 하였다. 이는 사용자로 하여금 불필요한 재검색의 불편을 없애고 자동적인 정보와 지식을 제공받을 수 있게 하는 장점을 갖는다.
본 논문은 정보 검색시스템의 구축에 있어서 온 톨로 지를 활용하여 문서들을 해석하여 정보검색시스템의 메 타데이타로 사용함으로써 시맨틱 검색을 유도하고 사용자 요구에 해당하는 질의문을 자동 생성하여 검색의 정확성과 효율성을 높이는 방법을 집중 연구하였다. 다음 절에서는 전체 검색시스템의 구조에서 온톨로지의 구축 방안과 메타데이타 생성 부분에 대해 구체적으로 설명하도록 한다
이러한 정보의 홍수 속에서 시맨틱웹 기술을 사용한 시맨틱 검색방식은 사용자에게 유용한 정보와 지식을 보다 정확하고 쉽게 찾게 해 준다. 본 연구는 시맨틱웹 기술과 온톨로지를 활용하여 효율적인 검색 시스템을 만들고자 하였다. 본 논문에서 제안하는 방법은 시맨틱 검색시스템으로 복잡한 질의문을 수행하기 위하여 온톨로지를 구축하고 온톨로지 바탕 의 클래스와 다양한 프로퍼티를 사용하여 온톨로지 기반 질의문으로 자동생성하고 트리플 컨버터를 구축하여 추론 엔진으로로 하여금 OWL에서 정의된 공리로 온톨로지와 메타데이타 지식베이스의 추론을 통해 별도의 자연 어처리 없이 복잡한 질의문의 검색을 보다 정확하게 수행하는 방식이다.
그러므로 본 논문에서 제안하는 시스템의 효율성을 증명하기 위해서 온 톨 로지를 추론하여 나온 검색 결과에 대한 타당성을 검증 할 실험을 추가적으로 수행하였다. 아직까지 시맨틱 검색 시스템에 관한 정량적인 성능평가에 관한 연구는 거의 보고되지 않았고 추가적으로 검색된 부분에 대한 평가가 이루지기 힘들기 때문에 본 논문에서는 제안하는 시맨틱 검색시스템의 정확성과 효율성을 검증하기 위해서 다양한 검색 시나리오를 바탕으로 동일한 질의문을 DQL 시스템과 본 시스템에 적용한 후 사용자로부터 검색 결과에 대한 만족도를 평가받는 실험을 수행하였다. 다양한 검색조건을 상대로 사용자에게 검색 만족도 평가를 5단계로 나누어 입력하도록 하였다.
이러한 시맨틱웹의 영역은 비즈니스 업무 효율을 증가시키고 이를 통해 이윤 올 극대화 시키는 방법으로 시맨틱 검색을 통한 정보 검색시스 템으로 확대적용 될 수 있다. 이러한 정보 검색시스템에서의 목표는 저장되어있는 다량의 정보들 중에서 사용자가 요구하는 정보와 문서를 어떻게 하면 사용자의 의 도를 정확히 파악하여 효율적인 검색으로 누락되지 않고 요구문서를 사용자에게 제대로 전달할 수 있는가이다. 기존의 검색 시스템의 방식은 문서의 키워드를 추출하여 사용자가 요구하는 질의문과 단순한 매칭을 시도하고 키워드의 빈도수로써 결과를 보여준다.
이에 본 논문에서는 정보 검색시스템에 시맨틱웹의 개념을 적용시켜 기존의 정보 검색시스템의 문제를 개선하여, 보다 정확하고 효율성이 높은 시스템을 제안하고자 한다. 본 논문에서 제안하는 검색방식은 온톨로지를 기반으로 추론을 통한 시맨틱 검색 방법으로 다음과 같은 특징을 갖는다.
제안 방법
결과 조건절은 사용자가 검색 조건을 이용하여 찾고자 하는 결과를 의미하여 검색 조건절과 결과 조건절은, , 형태로 구성되며 프롤로그의 술어 형태플 갖는다, 이러한 구성을 가지는 온톨로지 기반의 질의문을 사용하여 본 시맨틱 검색시스템의 질의문 처리기는 자연어처리에 가까운 다양한 요구를 처리하기 위해 온 톨 로지를 통해 정의된 클래스와 프로퍼티를 사용자가 자 유롭게 선택함으로써 자동적으로 질의문을 생성하는 방식을 사용하였다.
실제적인 검색시스템 구현을 위하여 시스템의 도메인은 문화컨텐츠로 한정하여 구축하도록 한다. 구체적인 검색 도메인은 영화와 클래식 음악 공연에 관한 것으로써 2004년도에 개봉한 영화와 클래식 공연을 중심으로 지식 엔지니어링을 통해 충분한 시맨틱 검색상황을 고려하여 온톨로지를 구축하였다. 그리고 각 해당 메타데 이타는 실제 존재하는 영화와 공연에 대한 웹 문서들을 대상으로 문서해석을 통해 메타데이타로 생성하였다.
단순히 검색된 결과의 량만으로 검색 시스템의 정확성과 효율성을 평가하기는 어렵다. 그러므로 본 논문에서 제안하는 시스템의 효율성을 증명하기 위해서 온 톨 로지를 추론하여 나온 검색 결과에 대한 타당성을 검증 할 실험을 추가적으로 수행하였다. 아직까지 시맨틱 검색 시스템에 관한 정량적인 성능평가에 관한 연구는 거의 보고되지 않았고 추가적으로 검색된 부분에 대한 평가가 이루지기 힘들기 때문에 본 논문에서는 제안하는 시맨틱 검색시스템의 정확성과 효율성을 검증하기 위해서 다양한 검색 시나리오를 바탕으로 동일한 질의문을 DQL 시스템과 본 시스템에 적용한 후 사용자로부터 검색 결과에 대한 만족도를 평가받는 실험을 수행하였다.
구체적인 검색 도메인은 영화와 클래식 음악 공연에 관한 것으로써 2004년도에 개봉한 영화와 클래식 공연을 중심으로 지식 엔지니어링을 통해 충분한 시맨틱 검색상황을 고려하여 온톨로지를 구축하였다. 그리고 각 해당 메타데 이타는 실제 존재하는 영화와 공연에 대한 웹 문서들을 대상으로 문서해석을 통해 메타데이타로 생성하였다. 그리고 본 논문에서 제안하는 시스템의 각 구성 별로 트리 플 변환기, 시맨틱 추론 엔진, 질의문 처리기를 포함하는 사용자 인터페이스를 구현하였다.
그리고 각 해당 메타데 이타는 실제 존재하는 영화와 공연에 대한 웹 문서들을 대상으로 문서해석을 통해 메타데이타로 생성하였다. 그리고 본 논문에서 제안하는 시스템의 각 구성 별로 트리 플 변환기, 시맨틱 추론 엔진, 질의문 처리기를 포함하는 사용자 인터페이스를 구현하였다. 본 논문에서는 시맨틱 검색을 실험하기 위하여 웹 기반으로 시맨틱 검색 시스템을 구현하였다.
키워드 추출기와 메타데이타 자원 매칭 기로부터 재구성된 검색키워드는 온톨로지 기반 질의문 변환기를 통해 시맨틱 추론 검색엔진의 질의문으로 자동 생성되게 된다. 그리고 자동 생성된 질의문은 추론을 통해 메타데이타정제를 거친 메타데이타 자원으로부터 검색을 수행하게 된다. 질의문 처리기에 의한 검색 결과는 URI 같은 불필요한 요소를 제거하는 일반화 과정을 거쳐서 원본 문서와 연결하는 과정을 수행하게 된다.
넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적 으로 찾게 한다. 이렇게 시맨틱웹 기술을 적극 활용하므로 써 다량의 데이타에서 발견하기 힘든 정보와 지식을 자동적이고 정확하게 추출할 수 있다.
아직까지 시맨틱 검색 시스템에 관한 정량적인 성능평가에 관한 연구는 거의 보고되지 않았고 추가적으로 검색된 부분에 대한 평가가 이루지기 힘들기 때문에 본 논문에서는 제안하는 시맨틱 검색시스템의 정확성과 효율성을 검증하기 위해서 다양한 검색 시나리오를 바탕으로 동일한 질의문을 DQL 시스템과 본 시스템에 적용한 후 사용자로부터 검색 결과에 대한 만족도를 평가받는 실험을 수행하였다. 다양한 검색조건을 상대로 사용자에게 검색 만족도 평가를 5단계로 나누어 입력하도록 하였다. 여기서 검색 만족도의 5단계 중에서는 원치 않은 결과에 대해서는 음수를 입력하여 의도하지 않은 결과에 대해서는 가중치를 높게 주었다.
또한 시맨틱 검색시스템에서 시맨틱 추론 검색엔 진과의 연동 부분과 에이전트가 시맨틱 정보 제공 기능을 효과적으로 수행할 수 있는 추론 기관을 지원하는 장점이 있다[6, 7]. 따라서 본 논문에서는 OWJ 온톨로지 표현 언어를 이용하여 온톨로지와 온톨로지 메타데이타 들을 표현한다. 다음 표 1은 OWI을 이용하여 온톨로지를 표현하는 예제이다.
지금까지 시맨틱 검색 시스템에 관한 정량적인 성능 평가에 관한 연구는 거의 보고되지 않았다. 따라서 본 논문에서의 제안하는 시맨틱 검색시스템의 정확성과 효율성을 검증하기 위해서 검색 시나리오로부터 결과를 도출하는 실험을 수행하고 온톨로지 기반의 질의응답을 지원하는 DQL과 제안한 시스템의 결과를 비교함으로써 시스템의 성능 평가를 수행하였다.
본 논문은 食 과적인 검색시스템의 구축을 위해 서술 논리(Description Logic) 바탕의 온톨로지를 사용하여 메 타데이타를 생성하고 추론 엔진을 접목시켜 온톨로지의 계층구조와 규칙, 공리(axiom)를 사용하여 추론을 함으로써, 기존의 지식베이스에 없는 지식을 검색영역에 포함하므로 모호한 질의에 대하여 해당하는 문서의 검색이 가능한 시맨틱 검색을 사용하는 방법을 제안하였다. 먼저 본 논문에서 제안하는 정보 검색시스템의 전체적인 구조를 살펴보고 세부적인 부분을 언급하여 설명하도록 한다. 다음은 시맨틱 검색시스템의 전체적인 구조이다.
본 논문은 시맨틱 웹 환경에서의 검색 기법을 제안하였다. 본 검색 시스템은 온톨로지의 공리를 충분히 고려 한검색 시스템으로 기존의 온톨로지만 의 계층 구조를 이용하는 검색 방법보다 효율성을 높일 수 있었고 정확한 매칭의 한계를 보완하는 검색 방법으로 시맨틱 검색기법을 제안하였다. 이는 온톨로지를 근거로 하여 유사한 의미의 판별을 제안함과 동시에 온톨로지 공리를 사용함으로써 검색의 유연성을 높일 수 있는 방법이다.
첫 번째로, 정보 검색시스템 내에서 사용할 정보들을 정의하고 있는 온톨로지를 구축하고 온톨로지를 통해 해석(annotation)한 메타데 이타 지식베이스 부분, 두 번째로, 지식베이스를 정제하기 위해 메타데이타를 추론적 용이 가능하게 변환하고 추론 엔진을 통해 추론을 적용 시키는 부분, 마지막으로 사용자의 의도로부터 질의문을 자동 생성하여 검색을 수행하고 결과를 출력하는 인 터 페이스 부분으로 나눌 수 있다. 본 검색시스템은 단순한 키워드가 포함되어 있는 문서를 찾는 것이 아니라 사용자가 원하는 정보와 지식을 찾는 것에 중점을 두었다 즉, 일반적인 문서가 아니라 온톨로지로부터 생성된 메 타데이타를 바탕으로 이를 추론하고 온톨로지를 기반으로 질의문을 자동 생성하여 검색을 수행하는 방법을 사용한다는 것이다. 이러한 방법은 검색키워드와 문서의 키워드가 달라도 의미적으로 일치하면 온톨로지의 추론을 통해 검색이 가능하고 서로 다른 온톨로지의 컨셉을 규칙 기반 추론을 통해 유사한 컨셉으로 추출하여 검색 영역의 확장을 이끌어낼 수 있다.
본 논문에서 사용되는 지식베이스 정제방식은 기존의 구축된 메타데이타를 사용하여 시맨틱 검색을 수행할 때 추론 엔진은 OWI 정의하고 있는 공리를 사용하여 기존의 메타데이타를 풍부하게 하거나 또는 축약하는 방식을 사용한다.
본 논문에서 온톨로지 추론을 통하여 메타데이타를 검색하는 방법을 사용한다. 다음 그림 8은 기존 시스템에서 불가능한 검색 질의를 온톨로지 추론을 사용하여 검색이 가능한 시나리오이다.
이렇게 정제된 지식베이스는 결과적으로 시맨틱 검색을 수행하는 시맨틱 추론 검색 엔진 처리 부분의 자원이 된다. 본 논문에서 온톨로지를 주론 하여 시맨틱 검색을 수행하는 방식은 새로운 자원의 추가와 방대한 자원의 축약이라는 두 가지 접근 방법으로 보다 정확한 검색과 풍부한 검색 영역을 갖게 된다. 본 시스템은 이러한 두 가지 방식을 사용자의 의 도를 정확히 판단하여 동적으로 수행하였다.
이에 본 논문에서는 정보 검색시스템에 시맨틱웹의 개념을 적용시켜 기존의 정보 검색시스템의 문제를 개선하여, 보다 정확하고 효율성이 높은 시스템을 제안하고자 한다. 본 논문에서 제안하는 검색방식은 온톨로지를 기반으로 추론을 통한 시맨틱 검색 방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다.
본 연구는 시맨틱웹 기술과 온톨로지를 활용하여 효율적인 검색 시스템을 만들고자 하였다. 본 논문에서 제안하는 방법은 시맨틱 검색시스템으로 복잡한 질의문을 수행하기 위하여 온톨로지를 구축하고 온톨로지 바탕 의 클래스와 다양한 프로퍼티를 사용하여 온톨로지 기반 질의문으로 자동생성하고 트리플 컨버터를 구축하여 추론 엔진으로로 하여금 OWL에서 정의된 공리로 온톨로지와 메타데이타 지식베이스의 추론을 통해 별도의 자연 어처리 없이 복잡한 질의문의 검색을 보다 정확하게 수행하는 방식이다. 이러한 추론 검색방식은 질의문을 온 톨 로지를 기반으로 확장시키는 형태로써 키워드가 달라 도 의미적으로 유사한 컨셉을 찾아주게 된다.
본 논문에서 제안하는 시맨틱 검색시스템을 설명하기 전에 기존의 연구들을 살펴보았다. 앞에서 살펴본 방법 들은 완전한 시맨틱 검색이라 말하기 힘들다.
DQL 시스템은 기본적으로 정확한 매치만을 지원하기 때문에 온톨로지의 다양한 속성을 이용하지만 효율성에 있어서 공리를 이용한 추론 방법과 비교해 볼 때 낮은 효율성이 문제 될 수 있다. 본 논문에서 제안하는 시맨틱 검색은 온톨로지를 기반으로 하기 때문에 일반 태그가 아닌 키워드에 의미를 부여하는 태그를 사용하며. 태그의 계층적 구조도 활용한다.
이것은 검색조건이 많이 질수록 온톨로지로부터 추론될 수 있는 가능성이 증가하는 것과 다수의 검색조건을 만족하는 메타데이타가 없을 때 오히려 온톨로지를 추론하여 나올 수 있는 메타데이타가 늘어날 수 있다는 사실을 보여준다. 본 논문에서 제안하는 시스템은 정확한 매칭이 이루어지지 않을 때에 온톨로지를 추론하여 질의문을 확장하는 방식이다. 이는 기존의 DQL 검색 시스템보다 동일하거나 그보다 많은 검색 결과를 출력한다.
앞에서 언급한 대로 시맨틱 검색은 온톨로지를 바탕으로 생성된 메타데이타와 추론 엔진 을 통한 전 방향 추론기법을 사용하여 검색하기 때문에 적용이 가능하다. 본 논문에서 제안한 시스템은 프롤로 그(Prolog) 언어를 기반으로 시맨틱 추론 검색 엔진을 구축하였다. 시맨틱 추론 검색 엔진에서는 OWL로 생성 된 메타데 이타를 KIF(Knowledge Interchange Format) 형태로 읽어 들여 전 방향을 추론을 수행할 수 있도록 술어(Predicate) 형태로 변환과정을 거쳐서 추론 및 검색을 수행하게 된다[82이.
본 논문에서는 온톨로지의 계층구조를 이용한 추론을 검색에 적용시킨다. 다음의 표 4와 그림 11의 검색 시나리오 보듯이 사용자가 원하는 질의의 의미를 이해하여 AT에 위치하는 T-1 극장에서 영화 X를 상영하지는 않지만 Location 온톨로지의 계층구조를 추론하여 AT과 장소가 유사한 A-2에 위치하는 T-2를 검색하여 사용자에게 T-2 극장에서 영화 X가 상영한다는 정보를 자동 적으로 알려주는 것이 가능하다.
본 논문의 시맨틱 검색시스템에서 자연어와 유사한 검색영역을 갖기 위해서는 온톨로지를 기반으로 사용자의 요구에 맞는 질의문을 시맨틱 추론 검색엔진의 형태에 맞는 정확한 질의문으로 자동 생성하여야 한다. 다음 그림 7은 온톨로지 기반 질의문 자동 생성방식에 대한 구조이다.
앞서 언급한 시맨틱 질 의문을 생성한 후에는 시맨틱 검색 알고리즘에 따라서 검색을 수행한다. 본 논문의 시맨틱 추론 검색 엔진은 다음 그림 6과 같은 알고리즘에 따라서 시맨틱 검색을 수행한다. 초기에 사용자로부터 입력된 질의문의 검색 조건은 단일 검색 조건일 수도 있지만 일반적인 경우에 다중 검색 조건의 형태를 갖는다.
왜냐하면 문서에 포함되는 키워드에 바로크 음악이라는 부분으로 매칭 되는 부분이 없기 때문이다. 본 논문의 시스템에서는 작곡가 '헨델'에 대한 정보가 계충구조로써 '바로크 음 악어1 속한다는 것이 온톨로지에 존재하고 음악 온 톨로 지의 인스턴스로써 '물 위의 음악'에 대한 메타데이타와 '물 위의 음악'이 내포된 C공연의 메타데 이타가 존재하기 때문에 사용자의 질의에 대해서 C 음악회라고 답변할 수 있게 된다.
본 논문에서 온톨로지를 주론 하여 시맨틱 검색을 수행하는 방식은 새로운 자원의 추가와 방대한 자원의 축약이라는 두 가지 접근 방법으로 보다 정확한 검색과 풍부한 검색 영역을 갖게 된다. 본 시스템은 이러한 두 가지 방식을 사용자의 의 도를 정확히 판단하여 동적으로 수행하였다.
본 논문에서는 시맨틱 검색을 수행하기 위한 시맨틱 검색 메커니즘에 대해 제안한다. 앞서 언급한 시맨틱 질 의문을 생성한 후에는 시맨틱 검색 알고리즘에 따라서 검색을 수행한다. 본 논문의 시맨틱 추론 검색 엔진은 다음 그림 6과 같은 알고리즘에 따라서 시맨틱 검색을 수행한다.
앞에서 언급한 방법으로 온톨로지를 구축하고 검색 시스템의 도메인에서 사용될 기존의 문서와 새로 생성될 문서들을 수집하고 이를 해석 도구를 사용하여 메타 데이타로 생성한다. 온톨로지 구축과 메타데이타의 생성에 관한 부분은 현재까지는 수동적으로 수행되게 된다.
이렇게 구축된 온톨로지를 바탕으로 기존의 문서와 생성될 문서들에 대해서 해석을 수행한다. 즉, 시맨틱 검색 시스템에서 사용하게 될 메타데이타를 생성하게 된다.
본 시맨틱 검색 시스템의 트리플 변환기는 Jena의 RDF 파서를 사용하여 구현하였다[11, 12]. 이렇게 온 톨 로지와 메타데이타를 트리플 변환기를 통하여 PSO 형태의 트리플로 자동적으로 변환을 하고 다시 시맨틱 추론 검색엔진의 형태에 맞게 술어 형태로 변환 후 추론 엔진 의 작업 메모리에 넣어 전 방향 추론기를 통해 OWL의 공리와 사용자 요구 질의문을 바탕으로 구성된 규칙을 적용하여 전 방향 추론을 수행한다.
DQL 시스템과 제안한 시스템의 성능분석을 위하여 본 논문에서는 다음과 같은 실험을 하였다. 즉, 동일한 지식베이스를 공유하는 DQL 시스템과 시맨틱 검색 시스템을 상대로 동일한 질의문을 입력하여 각각 출력된 검색 결과에 대한 평균적인 정확도와 검색조건의 수에 따른 정확도를 살펴보았다. 다음 그림 10은 검색 조건에 대한 사용자들의 검색 만족도 평균값을 그래프로 나타낸 모습이다.
대상 데이터
여기서 검색 만족도의 5단계 중에서는 원치 않은 결과에 대해서는 음수를 입력하여 의도하지 않은 결과에 대해서는 가중치를 높게 주었다. 실험은 숭실대학교 컴퓨터학과에 재학 중인 대학원생과 일반인으로 구성된 피실험자들로부터 100개의 실험 데이타를 수집하였다. 다음 그림 12는 검색 조건에 따른 사용자의 만족도를 수치화하여 나타낸 그래프이다.
이론/모형
본 논문에서의 실제적인 검색시스템의 구현을 위하여 온톨로지는 온톨로지 구축 도구를 이용하여 OMHOnto- logy Web Language)의 형태로 구현하였다[6]. 본 논문에서 사용되는 온톨로지 표현 언어로 OWL 온톨로지 언어를 이용하는 이유는 OWL의 의미적 연관성과 미리 정의된 공리를 활용하면 다양한 추론이 가능하기 때문이다.
성능/효과
여기서 검색조건 7에 해당하는 사항은 온톨로지를 추론하여 나온 검색 결과에 대해 사 용자들은 오히려 낮은 점수를 부여함으로써 의도하지 않은 결과를 표현하였다. 그 외의 결과들은 DQL 시스 템보다 나은 검색 만족도를 기록하였다. 즉, 본 시스템에 의하여 온톨로지 기반의 유사한 컨셉이 검색되었을 때 DQL 시스템보다 검색 만족도 부분에서 상대적으로 높은 점수를 얻은 점을 알 수 있다.
다음 그림 10은 검색 조건에 대한 사용자들의 검색 만족도 평균값을 그래프로 나타낸 모습이다. 그림 10의 그래프에서 알 수 있듯이 본 논문에서 제안하는 시스템은 동일한 지식베이스를 공유하는 기존의 DQL 검색 시스템보다 좀 더 나은 검색의 정확도를 보였다. 이것은 DQL이 사용자의 질의문과 지식 베이스의 메타데이타가 정확한 일치를 보일 때만 검색을 수행할 수 있는 반면에 본 논문의 시스템은 정확한 일치를 찾아내지 못했을 때 온톨로지를 추론하여 유사한 컨셉을 검색할 수 있는 잘 의문으로 확장시켜서 재검 색을 수행하기 때문에 결과 그래프에서 보듯이 더 나온 정확도를 보인다.
셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다. 다섯째, 에이전트가 단순히 키워드가 포함된 문서만을 찾는 것이 아니라 온톨로지에 표현되어 있는 정보를 토대로 사용자가 원하는 정보와 지식을 자동적 으로 찾게 한다.
본 논문의 방식은 도메인 정보를 온톨로지를 통해 구 체적으로 정의하고 있으므로 사용자가 선택하는 검색키 워드의 의미를 검색시스템으로 하여금 정확히 이해할 수 있게 하여 표 3과 같이 보다 정확한 검색을 할 수 있다. 다음 표 5의 검색시나리오에서 보듯이 영화의 제 목을 모르는 상태에서 남자 주연배우의 출신학교를 검색하려면 몇 번의 검색을 거쳐야 한다.
본 논문의 방식은 온톨로지 기반의 추론을 사용하여 검색을 수행하므로 기존의 검색 방법에서 movie라는 키 워드와 cinema라는 키워드는 엄연히 다른 것처럼 검색 키워드와 사용자가 찾고자 하는 문서의 키워드가 불일치하면 의미적 맥락이 같아도 검색이 되지 않는 점을 표 3과 그림 9에서 보듯이 본 검색 시스템에서는 서로 다른 검색키워드를 온톨로지 기반 추론 엔진을 통해 규칙을 적용시켜서 정확한 일치가 아니어도 유사한 컨셉을 찾아주는 검색이 가능하다. 온톨로지 규칙에 의해 movie 클래스와 cinema 클래스는 sameClassAs라는 공리로 정의되어 있다.
본 논문에서는 시맨틱 검색을 실험하기 위하여 웹 기반으로 시맨틱 검색 시스템을 구현하였다. 본 논문의 시팬틱 검색 시스템에서 사용자는 원하는 검색 키워드 정보를 온톨로지를 기반으로 메뉴 형식으로 표현되는 검색 콤보박스에서 쉽게 도메인 정보를 선택해서 검색을 수행할 수 있다.
둘째, 규칙 기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치 (exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다. 셋째, 온톨로지가 검색 키워드의 의미를 뚜렷하게 정의할 수 있으므로 단순한 키워드 매칭과 빈도만으로 검색하는 것보다 정확한 검색이 가능하도록 한다. 넷째, 최적화된 질의문 자동 생성이 도메인 온톨로지를 통해 가능하므로 자연어와 유사한 검색영역과 정확성을 갖게 한다.
그림 10의 그래프에서 알 수 있듯이 본 논문에서 제안하는 시스템은 동일한 지식베이스를 공유하는 기존의 DQL 검색 시스템보다 좀 더 나은 검색의 정확도를 보였다. 이것은 DQL이 사용자의 질의문과 지식 베이스의 메타데이타가 정확한 일치를 보일 때만 검색을 수행할 수 있는 반면에 본 논문의 시스템은 정확한 일치를 찾아내지 못했을 때 온톨로지를 추론하여 유사한 컨셉을 검색할 수 있는 잘 의문으로 확장시켜서 재검 색을 수행하기 때문에 결과 그래프에서 보듯이 더 나온 정확도를 보인다. 다음 그림 11은 사용자가 입력한 검색 조건의 수에 따른 검색의 정확도를 나타낸 그래프이다.
본 그래프에서는 다수의 검색조건을 갖는 질의문이 검색의 정확도가 떨어지는 사실을 알 수 있다. 이것은 다 수의 검색조건을 만족하는 메타데이타가 부족한 현상으로 해석할 수도 있지만 기존의 DQL 시스템과 본 논문의 시스템의 정확도를 비교해보면 검색조건이 늘어날 때 본 시스템이 낮은 감소율을 갖는다는 것을 알 수 있다. 이것은 검색조건이 많이 질수록 온톨로지로부터 추론될 수 있는 가능성이 증가하는 것과 다수의 검색조건을 만족하는 메타데이타가 없을 때 오히려 온톨로지를 추론하여 나올 수 있는 메타데이타가 늘어날 수 있다는 사실을 보여준다.
그 외의 결과들은 DQL 시스 템보다 나은 검색 만족도를 기록하였다. 즉, 본 시스템에 의하여 온톨로지 기반의 유사한 컨셉이 검색되었을 때 DQL 시스템보다 검색 만족도 부분에서 상대적으로 높은 점수를 얻은 점을 알 수 있다.
본 논문에서 제안하는 검색방식은 온톨로지를 기반으로 추론을 통한 시맨틱 검색 방법으로 다음과 같은 특징을 갖는다. 첫째, 검색키워드와 문서의 키워드가 다르더라도 의미적으로 같으면 온톨로지의 추론을 통해 검색이 가능하게 한다. 둘째, 규칙 기반의 변환기가 서로 다른 온톨로지의 컨셉을 정확한 매치 (exact match)가 아니어도 유사한 컨셉으로 추론할 수 있게 한다.
이것 또한 검색 키워드와 원하는 문서의 키워드가 의미적으로 유사하지만 키워드 자체가 다를 경우 원하는 결과를 찾을 수 없다. 하지만 본 검색 시스템은 온톨로지 추론을 통해 검색 키워드가 달라도 의미적 맥락이 유사한 컨셉까지 찾아주게 되며 검색에이전트를 사용하여 자동적이 고 정확한 결과를 낼 수 있다.
후속연구
이는 온톨로지를 근거로 하여 유사한 의미의 판별을 제안함과 동시에 온톨로지 공리를 사용함으로써 검색의 유연성을 높일 수 있는 방법이다. 향후 연구에서는 온톨로지 모델링 시에 클래스와 프로퍼티를 적절하게 설정하는 전처리 부분에 대한 연구가 필요하겠다. 현재 온톨로지 모델링과 온톨로지 합병, 온톨로지 변환 등의 관련된 연구가 진행되고 있다.
참고문헌 (13)
Tim Berners-Lee, James Hendler and Ora Lassila, 'The Semantic Web,' Scientific American, 2001
R. Guha, Rob McCool, Eric Miller 'Semantic Search,' WWW2003 conference paper submission
Richard Fikes, Pat Hayes, Ian Horrocks, 'DQL - A Query Language for the Semantic Web,' WWW 2003, May 20-24, 2003, Budapest, Hungary
Deborah L. McGuinness and Richard Fikes, James Hendler, Lynn Andrea Stein, 'DAML +OIL:An Ontology Language for the Semantic Web,' IEEE 2002
Thomas R. Gruber, 'Toward Principles for the Design of Ontologies Used for Knowledge Sharing,' Standford Knowledge Systems Laboratory, 23 August 1993
Michael K. Smith, Chris Welty, Deborah L. McGuinness, 'OWL Web Ontology Language Guide,' W3C Recommendation 10 February 2004
Dan Connolly, Frank van Harmelen, Ian Horrocks, Deborah L. McGuinness, Peter F. Patel-Schneider, Lynn Andrea Stein, 'DAML+OIL Reference Description,' W3C Note 18 December 2001
Fikes, Richard, Jessica Jenkins, and Gleb Frank. 'JTP: A System Architecture and Component Library for Hybrid Reasoning,' Proceedings of the Seventh World Multiconference on Systemics, Cybernetics, and Informatics. Orlando, Florida, USA. July 27-30, 2003
'Knowledge Interchange Format,' draft proposed American National Standard (dpANS), http://logic.stanford.edu/kif/dpans.html
Fikes, Richard, Jessica Jenkins, and Qing Zhou. 'Including Domain-Specific Reasoners with Reusable Ontologies,' Proceedings of the 2003 International Conference on Information and Knowledge Engineering. Las Vegas, Nevada, USA. June 23-26, 2003
Frank Manola, Eric Miller, 'RDF Primer,' W3C Working Draft 23 January 2003
Andy Seaborne, 'Jena Tutorial: A Programmer's Introduction to RDQL,' April 2002
Richard Fikes, Deborah McGuinness, 'An Axiomatic Semantics for RDF, RDF-S, and DAML+OIL,' W3C, December 2001
※ AI-Helper는 부적절한 답변을 할 수 있습니다.