$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

시맨틱 웹 문서에 대한 키워드 검색 및 랭킹 기법
Keyword Search and Ranking Methods on Semantic Web Documents 원문보기

통신위성우주산업연구회논문지 = The Journal of Korea Society of Communication and Sapce Technology, v.7 no.3, 2012년, pp.86 - 93  

김연희 (부천대학교 e-비즈니스과) ,  오성균 (서일대학교 컴퓨터소프트웨어과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 시맨틱 웹에서 온톨로지와 메타데이터를 기술하는 OWL 문서를 대상으로 하는 키워드 검색 기법과 랭킹 기법을 제안한다. 제안한 키워드 검색 기법은 OWL 문서에 대한 키워드 검색 결과의 단위를 정보 리소스로 정의하고 질의 키워드의 범위를 클래스와 프로퍼티의 이름은 물론 리터럴 데이터까지 확장하였다. 그리고 클래스나 프로퍼티의 계층 관계, 동등 관계 등 OWL 문서에 정의되어 있는 기본적인 추론 요소들을 고려하여 직접 기술되어 있지 않지만 새롭게 유도되는 정보도 키워드 검색에 반영하였다. 또한 키워드를 통해 간접적으로 의미적 관계를 맺고 있는 정보 리소스에 대한 검색이 가능하기 때문에 질의 키워드와 관련이 있는 많은 수의 정보 리소스들을 검색할 수 있다. 제안한 랭킹 기법은 OWL 문서의 특성을 고려하여 다양한 요소를 순위 결정에 참여시킴으로써 사용자의 검색 만족도를 높일 수 있다. 본 논문에서 제안한 키워드 검색 기법과 랭킹 기법은 방송 프로그램과 같은 디지털 콘텐츠의 검색 등 다양한 분야에서 활용될 수 있다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose keyword search and ranking methods for OWL documents that describe metadata and ontology on the Semantic Web. The proposed keyword search method defines a unit of keyword search result as an information resource and expands a scope of query keyword to names of class and pro...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • “김진만”과 “MBC”가 질의 키워드로 주어진 복합 검색의 경우를 살펴보자.
  • 그런데 검색 기능을 제공하는 다양한 포털 사이트에서 제공하고 있는 연관 검색처럼 일반 사용자들은 자신이 제시한 키워드를 포함하고 있는 검색 결과와 연관된 다른 정보들까지 함께 결과로 반환받기를 원하는 경향이 있다. 그래서 본 논문에서는 질의 키워드를 포함하고 있는 정보 리소스를 검색 결과로 반환하면서 그 정보 리소스의 다른 특성 값들도 함께 반환하여 사용자의 검색 만족도를 향상시키고자 한다.
  • 본 논문에서는 OWL 문서의 온톨로지에서 정의한 하위 클래스 관계와 동등 클래스 관계를 이용한 추론을 통해 새롭게 유도되는 정보도 키워드 검색의 대상으로 포함시키고 사전에 그래프 탐색을 통해 키워드 검색 처리에 필요한 정보들을 인덱스와 저장 구조에 미리 저장해둠으로써 키워드 검색에 소요되는 시간을 단축시키고자 한다. 그리고 질의 키워드를 포함하고 있는 정보 리소스가 가지고 있는 다른 유용한 정보들도 함께 검색 결과로 반환함으로써 일반 사용자의 검색 만족도를 향상시키는데 목표를 두고 있다.
  • 기존의 웹 문서를 대상으로 하는 키워드 검색에서는 키워드가 문서에 발생하는 빈도수나 다른 문서로부터 링크된 개수, 다른 문서를 링크하고 있는 개수 등을 이용하여 검색 결과를 정렬하지만 OWL 문서를 대상으로 하는 키워드 검색에서는 기존 방식과 다른 랭킹 기법이 요구된다. 따라서 본 논문에서는 OWL 문서의 특성을 고려하여 클래스들간의 계층 구조, 도메인 전문가들의 의견, 키워드의 빈 도수, 연관 정보를 포함하고 있는 정도 등 다각적인 요소들을 반영해서 결과로 반환된 정보 리소스들의 랭킹을 평가하기 위해 정보 리소스와 질의 키워드와의 관련 정도를 계산할 수 있는 여러 개의 평가 함수를 제안한다.
  • 본 논문에서는 OWL 문서의 온톨로지에서 정의한 하위 클래스 관계와 동등 클래스 관계를 이용한 추론을 통해 새롭게 유도되는 정보도 키워드 검색의 대상으로 포함시키고 사전에 그래프 탐색을 통해 키워드 검색 처리에 필요한 정보들을 인덱스와 저장 구조에 미리 저장해둠으로써 키워드 검색에 소요되는 시간을 단축시키고자 한다. 그리고 질의 키워드를 포함하고 있는 정보 리소스가 가지고 있는 다른 유용한 정보들도 함께 검색 결과로 반환함으로써 일반 사용자의 검색 만족도를 향상시키는데 목표를 두고 있다.
  • 본 논문에서는 리터럴 데이터의 내용을 대상으로 하는 키워드 검색을 위해 별도의 키워드 인덱스를 제안한다. 본 논문에서 제안한 키워드 인덱스는 키워드 검색에 일반적으로 많이 활용되는 역 인덱스(inverted index) 구조를 이용한다.
  • 본 논문에서는 시맨틱 웹 환경에서 OWL 문서에 대한 효과적인 키워드 검색을 지원하기 위해 다음과 같은 내용을 제안한다.
  • OWL 문서에 기술된 다양한 요소들을 이용하여 키워드 검색을 하게 되는 경우 많은 정보 리소스가 결과로 반환된다. 본 논문에서는 정보 리소스의 클래스 타입과 정보 리소스 자체의 점수를 고려하고 질의 키워드와 정보 리소스의 관련성을 수치 화하여 평가함으로써 검색된 정보 리소스들을 중요도에 따라 정렬하여 제공함으로써 사용자의 검색 만족도를 높이고자 한다. 향후에 본 논문에서 제안한 키워드 검색 기법과 랭킹 기법을 적용한 프로토타입 시스템을 개발하여 정확성과 재현율, 그리고 질의 처리 시간에 대해 제안한 기법의 우수성을 평가하고자 한다.
  • 본 논문에서는 키워드 검색 결과로 질의 키워드를 포함하고 있는 정보 리소스만을 반환하는 것이 아니라 정보 리소스가 가지고 있는 모든 속성 값, 즉 프로퍼티 값들을 반환하여 연관 검색이 가능하도록 한다. 이를 위해 정보 리소스에 대해 프로퍼티 값으로 기술된 모든 값을 클러스터링하기 위한 리소스 인덱스를 제안한다.
  • 본 논문에서는 모든 정보 리소스가 개념을 명확하게 제시하기 위해 온톨로지에 정의된 특정 클래스 타입으로 반드시 선언된다고 가정한다. 정보 리소스는 URI로 식별되지만 본 논문에서는 참고 문헌[7]과 같이 정보 리소스를 식별하는 것은 물론 정보 리소스의 클래스 타입을 명시적으로 나타내기 위해 클래스의 이름과 OWL 문서 내 작성된 순서에 따라 각 정보 리소스마다 고유의 아이디를 부여한다. 그림 2에서 아이디가 "Program_1"인 정보 리소스는 그림 1에서 정의한 "Program" 클래스 타입이고 OWL 문서에서 첫 번째로 출현한 것임을 의미한다.
  • 본 논문에서는 정보 리소스의 클래스 타입과 정보 리소스 자체의 점수를 고려하고 질의 키워드와 정보 리소스의 관련성을 수치 화하여 평가함으로써 검색된 정보 리소스들을 중요도에 따라 정렬하여 제공함으로써 사용자의 검색 만족도를 높이고자 한다. 향후에 본 논문에서 제안한 키워드 검색 기법과 랭킹 기법을 적용한 프로토타입 시스템을 개발하여 정확성과 재현율, 그리고 질의 처리 시간에 대해 제안한 기법의 우수성을 평가하고자 한다.

가설 설정

  • 클래스이름”으로 표현한다. 본 논문에서는 경로의 시작 클래스와 끝 클래스가 일치하지 않는다고 가정하고 경로의 길이는 해당 경로 표현에 존재하는 프로퍼티의 개수로 정의한다. 여러 개의 기본 경로로 구성된 복잡한 경로를 통해 의미적 관계를 맺는 클래스가 존재할 수도 있다.
  • 리터럴 데이터로 표현된 정보 리소스의 프로퍼티 값은 직사각형으로 표현한다. 본 논문에서는 모든 정보 리소스가 개념을 명확하게 제시하기 위해 온톨로지에 정의된 특정 클래스 타입으로 반드시 선언된다고 가정한다. 정보 리소스는 URI로 식별되지만 본 논문에서는 참고 문헌[7]과 같이 정보 리소스를 식별하는 것은 물론 정보 리소스의 클래스 타입을 명시적으로 나타내기 위해 클래스의 이름과 OWL 문서 내 작성된 순서에 따라 각 정보 리소스마다 고유의 아이디를 부여한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
본 논문에서 시맨틱 웹 환경에서 OWL 문서에 대한 효과적인 키워드 검색을 지원하기 위해서 제안한 내용은? 첫째, OWL 문서의 특성을 고려하여 질의 키워드의 범위와 반환되는 검색 결과의 단위를 정의하고 키워드 검색의 유형을 분류한다. 둘째, OWL 문서에 적합한 키워드 검색을 지원하는 인덱스 구조와 질의 처리 전략을 제안한다. 마지막으로 키워드 검색을 요청한 사용자의 만족도를 높이기 위해 키워드 검색 결과를 랭킹하는 기법을 제안한다.
키워드 검색의 장점은? 사용자가 제시한 질의 키워드를 포함하고 있는 데이터를 검색하여 결과로 반환하는 키워드 검색은 인터넷 상에 존재하는 웹 페이지뿐만 아니라 관계형 데이터베이스나 XML 문서 등 다양한 검색 대상을 위한 질의 처리 기법으로 널리 사용되고 있다[1, 2]. 키워드 검색은 데이터의 내부적 구조나 특별한 질의 언어를 몰라도 쉽게 원하는 데이터를 검색할 수 있다는 장점 때문에 일반 사용자들이 선호하는 검색 방식이다[1, 2]. 따라서 사용자의 검색 만족도와 검색 정확도를 향상시키면서 다양한 분야에서 키워드 검색을 활용하기 위한 연구가 계속 진행되고 있다.
키워드 검색은 무엇을 위해 사용되는가? 사용자가 제시한 질의 키워드를 포함하고 있는 데이터를 검색하여 결과로 반환하는 키워드 검색은 인터넷 상에 존재하는 웹 페이지뿐만 아니라 관계형 데이터베이스나 XML 문서 등 다양한 검색 대상을 위한 질의 처리 기법으로 널리 사용되고 있다[1, 2]. 키워드 검색은 데이터의 내부적 구조나 특별한 질의 언어를 몰라도 쉽게 원하는 데이터를 검색할 수 있다는 장점 때문에 일반 사용자들이 선호하는 검색 방식이다[1, 2].
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로