최근 웹 데이터는 폭발적으로 증가하고 있다. 그러나 현재의 월드와이드웹(WWW) 기술은 단순 키워드 검색을 통한 데이터 선별을 기본으로 하고 있기 때문에 웹 데이터들의 의미적인 정보를 효과적으로 처리하기에는 적합하지 않다. 이러한 문제점을 해결하기 위하여 1999년 말에 제안된 시맨틱 웹은 정보의 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 패러다임이다. 시맨틱 웹은 정보의 의미적 부여를 위하여 공유된 데이터들을 개념화한 정형적이고 명백한 규정인 ...
최근 웹 데이터는 폭발적으로 증가하고 있다. 그러나 현재의 월드와이드웹(WWW) 기술은 단순 키워드 검색을 통한 데이터 선별을 기본으로 하고 있기 때문에 웹 데이터들의 의미적인 정보를 효과적으로 처리하기에는 적합하지 않다. 이러한 문제점을 해결하기 위하여 1999년 말에 제안된 시맨틱 웹은 정보의 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 패러다임이다. 시맨틱 웹은 정보의 의미적 부여를 위하여 공유된 데이터들을 개념화한 정형적이고 명백한 규정인 온톨로지를 지식창고로 사용한다. 따라서 온톨로지의 효율적인 생성은 시맨틱 웹의 연구에 빠질 수 없는 중요한 부분이다. 그러나 온톨로지의 전통적인 생성방법은 시간과 비용이 많이 든다는 단점을 갖는다. 그러므로 본 논문은 이러한 단점을 해결하고 현재의 월드와이드웹에서 차세대 웹인 시맨틱 웹으로의 전환에 도움을 주기 위하여 데이터베이스를 이용하여 효율적으로 온톨로지를 생성할 수 있는 방법을 제안한다. 전통적인 온톨로지 생성방법은 많은 부분을 휴리스틱에 의존한다. 휴리스틱을 통한 온톨로지의 생성은 풍부한 어휘와 정형적 의미에 충실한 온톨로지를 생성 할 수 있다. 그러나 휴리스틱의 의존성이 높기 때문에 많은 시간과 비용을 소비하는 단점을 갖는다. 온톨로지의 전통적인 생성방법의 단점을 해결하기 위해 최근 많은 연구가 진행 되었다. 그러나 최근 진행 된 연구들은 휴리스틱의 의존성을 낮추어 전통적인 온톨로지 생성방법보다 시간과 비용을 단축시키는 효과를 갖으나 분석, 설계, 키워드 색출, 데이터 선별등과 같은 과정이 반드시 필요하다. 본 논문은 분석, 설계과정을 축소하고, 키워드 색출, 데이터 선별 등의 작업을 최소화하기 위하여 데이터베이스를 이용한다. 데이터베이스는 현재 정보를 다루는 대부분의 시스템에서 정보를 저장하는 저장소로서 상호 연관을 잘 나타내고 있는 데이터의 모임이다. 데이터베이스는 분석, 설계과정을 거친 결과물로서 그 스키마는 데이터베이스가 나타내고자 하는 도메인의 데이터를 잘 표현하고 있다. 이것은 도메인 온톨로지를 생성하기에 좋은 기초 자료로서 분석, 설계, 키워드 색출, 데이터 선별등과 같은 작업에 소요되는 시간과 비용을 줄 일 수 있다. 온톨로지는 “skeletal”방법론에 따르면 인지, 생성, 평가, 기록의 과정을 거쳐 생성된다. “skeletal”방법론의 과정 중 생성과정은 갈무리, 코딩, 통합과정으로 세분화 된다. 본 논문은 “skeletal”방법론의 두 번째 과정인 생성과정 중 갈무리, 코딩부분에 초점을 둔다. 본 논문의 생성 알고리즘은 데이터베이스를 선택, 데이터베이스 스키마를 통한 개념그래프를 생성, 튜플매핑을 통한 개념그래프 확장, 개념그래프의 기술 과정을 통하여 온톨로지를 생성한다. 또한 생성된 온톨로지를 유효검사기를 사용하여 온톨로지의 정확성을 판별한다. 데이터베이스는 데이터모델의 구현 결과로서 데이터 모델의 분석, 설계 결과를 내포한다. 본 논문의 알고리즘은 데이터모델로부터 데이터베이스로 이어지는 테이블 이름과 상호연관을 온톨로지의 각 구성 요소와의 매핑을 통하여 개념그래프의 골격을 형성한다. 형성된 개념그래프의 골격에 관계정의를 통하여 개념그래프로 확장을 한다. 확장된 개념그래프는 온톨로지의 기본골격으로 데이터베이스 각 구성과 온톨로지 개체간의 매핑관계를 이용하여 온톨로지로 확장하고 이를 온톨로지 기술언어를 이용하여 기술 한다. 유효한 온톨로지의 검증은 문법적 오류, 온톨로지의 연관위치, 도메인 관련어휘의 정확한 기술과 같은 심사를 통하여 이루어진다. 본 논문에서의 온톨로지 검증은 맨체스터대학교에서 제공하는 유효검사기를 통하여 생성된 온톨로지를 검증하였다. 본 논문에서 제안한 데이터베이스를 이용한 온톨로지 생성방법은 전통적인 온톨로지 생성방법의 시간과 비용 시간의 문제를 (반)자동적인 방법으로 해결하고 기존 연구들의 분석, 설계, 키워드 색출, 데이터 선별 등의 사전작업을 배제함으로서 더욱 효율적인 온톨로지를 생성 할 수 있다. 효율적인 온톨로지의 생성은 기존의 월드와이드웹의 자료창고인 데이터베이스를 이용하여 차세대 웹의 지식창고인 온톨로지로 변환에 도움을 준다. 따라서 본 논문에서 제안한 데이터베이스를 이용한 효율적인 온톨로지 생성방법은 기존의 월드와이드웹에서 차세대 웹인 시맨틱 웹으로 발전하는데 좀 더 효율적이고 효과적인 길을 열어 준다.
최근 웹 데이터는 폭발적으로 증가하고 있다. 그러나 현재의 월드와이드웹(WWW) 기술은 단순 키워드 검색을 통한 데이터 선별을 기본으로 하고 있기 때문에 웹 데이터들의 의미적인 정보를 효과적으로 처리하기에는 적합하지 않다. 이러한 문제점을 해결하기 위하여 1999년 말에 제안된 시맨틱 웹은 정보의 의미를 부여하고 이를 통해 컴퓨터와 사람이 협동적으로 작업을 수행할 수 있도록 하는 패러다임이다. 시맨틱 웹은 정보의 의미적 부여를 위하여 공유된 데이터들을 개념화한 정형적이고 명백한 규정인 온톨로지를 지식창고로 사용한다. 따라서 온톨로지의 효율적인 생성은 시맨틱 웹의 연구에 빠질 수 없는 중요한 부분이다. 그러나 온톨로지의 전통적인 생성방법은 시간과 비용이 많이 든다는 단점을 갖는다. 그러므로 본 논문은 이러한 단점을 해결하고 현재의 월드와이드웹에서 차세대 웹인 시맨틱 웹으로의 전환에 도움을 주기 위하여 데이터베이스를 이용하여 효율적으로 온톨로지를 생성할 수 있는 방법을 제안한다. 전통적인 온톨로지 생성방법은 많은 부분을 휴리스틱에 의존한다. 휴리스틱을 통한 온톨로지의 생성은 풍부한 어휘와 정형적 의미에 충실한 온톨로지를 생성 할 수 있다. 그러나 휴리스틱의 의존성이 높기 때문에 많은 시간과 비용을 소비하는 단점을 갖는다. 온톨로지의 전통적인 생성방법의 단점을 해결하기 위해 최근 많은 연구가 진행 되었다. 그러나 최근 진행 된 연구들은 휴리스틱의 의존성을 낮추어 전통적인 온톨로지 생성방법보다 시간과 비용을 단축시키는 효과를 갖으나 분석, 설계, 키워드 색출, 데이터 선별등과 같은 과정이 반드시 필요하다. 본 논문은 분석, 설계과정을 축소하고, 키워드 색출, 데이터 선별 등의 작업을 최소화하기 위하여 데이터베이스를 이용한다. 데이터베이스는 현재 정보를 다루는 대부분의 시스템에서 정보를 저장하는 저장소로서 상호 연관을 잘 나타내고 있는 데이터의 모임이다. 데이터베이스는 분석, 설계과정을 거친 결과물로서 그 스키마는 데이터베이스가 나타내고자 하는 도메인의 데이터를 잘 표현하고 있다. 이것은 도메인 온톨로지를 생성하기에 좋은 기초 자료로서 분석, 설계, 키워드 색출, 데이터 선별등과 같은 작업에 소요되는 시간과 비용을 줄 일 수 있다. 온톨로지는 “skeletal”방법론에 따르면 인지, 생성, 평가, 기록의 과정을 거쳐 생성된다. “skeletal”방법론의 과정 중 생성과정은 갈무리, 코딩, 통합과정으로 세분화 된다. 본 논문은 “skeletal”방법론의 두 번째 과정인 생성과정 중 갈무리, 코딩부분에 초점을 둔다. 본 논문의 생성 알고리즘은 데이터베이스를 선택, 데이터베이스 스키마를 통한 개념그래프를 생성, 튜플 매핑을 통한 개념그래프 확장, 개념그래프의 기술 과정을 통하여 온톨로지를 생성한다. 또한 생성된 온톨로지를 유효검사기를 사용하여 온톨로지의 정확성을 판별한다. 데이터베이스는 데이터모델의 구현 결과로서 데이터 모델의 분석, 설계 결과를 내포한다. 본 논문의 알고리즘은 데이터모델로부터 데이터베이스로 이어지는 테이블 이름과 상호연관을 온톨로지의 각 구성 요소와의 매핑을 통하여 개념그래프의 골격을 형성한다. 형성된 개념그래프의 골격에 관계정의를 통하여 개념그래프로 확장을 한다. 확장된 개념그래프는 온톨로지의 기본골격으로 데이터베이스 각 구성과 온톨로지 개체간의 매핑관계를 이용하여 온톨로지로 확장하고 이를 온톨로지 기술언어를 이용하여 기술 한다. 유효한 온톨로지의 검증은 문법적 오류, 온톨로지의 연관위치, 도메인 관련어휘의 정확한 기술과 같은 심사를 통하여 이루어진다. 본 논문에서의 온톨로지 검증은 맨체스터대학교에서 제공하는 유효검사기를 통하여 생성된 온톨로지를 검증하였다. 본 논문에서 제안한 데이터베이스를 이용한 온톨로지 생성방법은 전통적인 온톨로지 생성방법의 시간과 비용 시간의 문제를 (반)자동적인 방법으로 해결하고 기존 연구들의 분석, 설계, 키워드 색출, 데이터 선별 등의 사전작업을 배제함으로서 더욱 효율적인 온톨로지를 생성 할 수 있다. 효율적인 온톨로지의 생성은 기존의 월드와이드웹의 자료창고인 데이터베이스를 이용하여 차세대 웹의 지식창고인 온톨로지로 변환에 도움을 준다. 따라서 본 논문에서 제안한 데이터베이스를 이용한 효율적인 온톨로지 생성방법은 기존의 월드와이드웹에서 차세대 웹인 시맨틱 웹으로 발전하는데 좀 더 효율적이고 효과적인 길을 열어 준다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.