$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

온톨로지 기반 지능형 규칙 구성요소 추출에 관한 연구
Ontology - Based Intelligent Rule Components Extraction 원문보기

한국지능정보시스템학회 2006년도 춘계학술대회, 2006 June 01, 2006년, pp.237 - 244  

김우주 (연세대학대학교 정보산업공학과) ,  채상용 (연세대학대학교 정보산업공학과) ,  박상언 (한국과학기술원 테크노경영대학원)

초록
AI-Helper 아이콘AI-Helper

시맨틱 웹 관련연구가 증가함에 따라 하나의 관련분야로 규칙기반 시스템 동의 지능적인 웹 환경에 대한 기대 역시 커지고 있다. 하지만 규칙기반 시스템을 활용하기에는 아직도 규칙습득이 많은 제약이 되고 있다. 규칙습득은 웹으로부터 필요한 규칙을 습득하는 일련의 방법인데, 이러한 규칙을 습득하기 위해서는 규칙구성요소를 먼저 식별해야만 한다. 그러나 이러한 규칙을 식별하는 작업은 대부분 지식관리자의 수작업에 의해 이루어지고 있다. 본 연구의 목적은 웹으로부터 규칙구성요소 식별을 최대한 자동화하고 지식관리자의 수작업을 최소화함으로써 그 부담을 줄여 주는 데 있다. 이러한 방법으로는 온톨로지를 근간으로 하여 웹 페이지와의 문자열 비교, 이러한 비교의 한계를 극복하기 위한 확장등의 방법이 있다. 첫 번째 방법은 온툴로지 기반으로 규칙식별 할 웹 페이지와 비교를 통해 지식관리자의 규칙식별 과정을 최대한 자동화하여 주는 것이다. 여기서 만약 현재 규칙을 식별하고자 하는 웹 사이트와 유사한 시스템의 규칙들을 활용하여 일반화 된 온툴로지가 구축되었다면, 이 온톨로지를 기반으로 규칙을 식별하고자 하는 웹사이트와의 비교를 통해 규칙구성요소를 자동화하여 추출 할 수 있다. 이러한 온툴로지를 기반으로 규칙을 식별하기 위해서는 문자열 비교 기법을 사용하게 된다. 하지만 단순한 문자열 비교 기법만으로는 규칙을 식별하는 데에 자연어 처리에 대한 한계가 있다. 이를 극복하기 위해 다음의 두 번째 방법을 사용하고자 한다. 두 번째 방법은 정형화되지 않은 정보들을 확장하여 사용하는 것이다. 우선 찾고자 하는 단어들의 원형을 찾기 위한 스테밍 알고리즘 기법, WordNet을 이용하여 동의어 유의어등으로 확장을 하는 WordNet Expansion 기법, 의미 유사도를 측정하기 위한 방법인 Semantic Similarity Measure 등을 단계적으로 수행하여 자동화되고 정확한 규칙식별을 하고자 한다. 이러한 방법들의 조합으로 인하여 규칙구성요소 추출이 되지 않을 후보 단어들의 수를 줄여서 보다 더 정확하고, 지능적인 규칙구성요소 추출 방법론을 제시하고 구현하여 지식관리자의 규칙습득에 대한 부담을 줄여 주고자 한다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구에서는 본 연구의 목적과 맞게 새로운 의미유사도 측정방안을 제안하고자 한다. 이는 두 단어들이 상위어, 하위어 관계이 있으면 그 pathlength 를 구하여 의미유사도를 즉정하고자 한다.
  • 이 연구에서 규칙식별을 위한 첫 번째 단계인 규칙 구성요소 식별단계에서는 문자열 비교와 지식관리자가 수작업으로 규칙 구성요소를 식별을 하게 되어 있다. 본 연구에서는 이러한 규칙 구성요소의 식별을 자동화시켜주어 지식관리자의 부담을 줄여주고, 찾아내지 못했던 규칙 구성요소들을 자동적으로 찾아 주고자 하는 방법을 제안하였다.
  • 본 장에서는 규칙 구성요소 식별 시 온톨로지의 역할 및 온톨로지를 활용한 규칙 구성요소 식별과 관련된 접근 방법을 설명하고자 한다.
  • 웹으로부터 규칙 구성요소를 추출하여 지식을 추출하는 연구는 온톨로지를 활용하여 좀 더 쉽고 효율적인 지식 습득 방법론을 제안하고자 노력하고 있다. 따라서 이러한 온톨로지의 활용이 규칙 습득에도 도움을 줄 수 있을 것으로 기대된다.
  • 우선 규칙을 식별하기 위하여서는 기준이 되는 기준 온톨로지가 필요하다. 이는 기존연구인 XRML 방법론 [Kang and Lee, 2005], [Park and Lee, 2006] 에서 Amazon.com에 관하여 추출한 규칙 구성요소의 온톨로지를 이용하여 유사한 도메인인 웹 페이지(ex. Baens&Nobles.com)로부터 규칙 구성요소를 추출하고자 한다.
  • 규칙 구성요소 식별과 관련된 작업으로 웹 페이지로부터 규칙을 구성하고 있는 변수 (variables)나 변수값 (values) 을 찾아내어서 이를 조합하여 규칙을 만들어 낸다. 이때, 현재까지 규칙 구성요소를 식별해 올 때 단순히 문자열 비교로 이루어져 있던 식별과정을 2장에서 설명하였던 관련 연구들 (owl의 사용, 워드넷 확장, 스테밍 알고리즘 사용, 의미유사도 측정 방법)을 토대로 이를 자동화 시켜주고자 한다. 이를 위해서 다음과 같은 방법을 사용하였다.
  • °1 방법은 우선 규칙 식별 요소인 변수(variables)와 변수값 (values) 을 추출해 오고, 추출된 규칙식별 요소들을 결합하고 조합하여 규칙을 구성하게 된다. 이러한 순차적인 방법을 통하여 본 연구에서는 규칙 구성요소를 자동적으로 추출해오는 방법론을 제안하고 구현하고자 한다.
  • 이는 웹 페이지에 존재하는 수많은 규칙 구성요소의 후보들 중에 온톨로지에는 나타나 있지만 웹 페이지에 그 규칙 구성요소들의 후보가 온톨로지 인스턴스들의 유의어나 동의어 등으로 존재 할 때, 규칙 구성요소후보자들을 규칙 구성요소로 추출해 올 수가 없다. 이를 보완하기 위해서 워드넷을 가지고 각 인스턴스들을 확장하여 규칙 구성요소 추출을 하고자 하는 것이다. 이를 위해서 워드넷 2.
본문요약 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로