[국내논문]구조적 학술용어사전 "STNet"의 추론규칙 생성에 의한 의미 검색에 관한 연구 A Study on the Semantic Search using Inference Rules of the Structured Terminology Glossary "STNet"원문보기
본 연구의 목적은 이미 구축되어 있는 RDB 형식의 학술용어사전에 온톨로지 구조와 추론 규칙을 형성시킨 후 이를 의미 검색에 적용하는 상향(Bottom-up) 방식의 방법론을 제안하고 검증하는 것이다. 이를 위해 구조적 학술용어사전 "STNet"을 테스트베드로 삼아 Protege를 이용해 온톨로지 구조를 생성하고, 온톨로지 구조의 오류를 검증하였으며, STNet에 입력된 실제 데이터로 실험을 위한 테스트 데이터를 구축하였다. 그리고 추론 제한 규칙과 검증에 필요한 시나리오를 설정한 후, TBox 검증과 SPARQL 질의에 의한 결과 값을 평가하였다. TBox 검증 결과 본 연구에서 생성한 추론규칙이 모두 참으로 나타났으며, SPARQL 질의를 통한 결과값의 평가 결과 기존의 키워드 검색 수행에서는 파악하기 힘든 복잡한 검색 시나리오에 대해, 의미적으로 연관되는 용어를 효율적으로 조합해 검색 결과로 보여주는 것으로 나타났다.
본 연구의 목적은 이미 구축되어 있는 RDB 형식의 학술용어사전에 온톨로지 구조와 추론 규칙을 형성시킨 후 이를 의미 검색에 적용하는 상향(Bottom-up) 방식의 방법론을 제안하고 검증하는 것이다. 이를 위해 구조적 학술용어사전 "STNet"을 테스트베드로 삼아 Protege를 이용해 온톨로지 구조를 생성하고, 온톨로지 구조의 오류를 검증하였으며, STNet에 입력된 실제 데이터로 실험을 위한 테스트 데이터를 구축하였다. 그리고 추론 제한 규칙과 검증에 필요한 시나리오를 설정한 후, TBox 검증과 SPARQL 질의에 의한 결과 값을 평가하였다. TBox 검증 결과 본 연구에서 생성한 추론규칙이 모두 참으로 나타났으며, SPARQL 질의를 통한 결과값의 평가 결과 기존의 키워드 검색 수행에서는 파악하기 힘든 복잡한 검색 시나리오에 대해, 의미적으로 연관되는 용어를 효율적으로 조합해 검색 결과로 보여주는 것으로 나타났다.
This study describes the Bottom-up method for implementation of an ontology system from the RDB. The STNet, a structured terminology glossary based on RDB, was served as a test bed for converting to RDF ontology, for generating the inference rules, and for evaluating the results of the semantic sear...
This study describes the Bottom-up method for implementation of an ontology system from the RDB. The STNet, a structured terminology glossary based on RDB, was served as a test bed for converting to RDF ontology, for generating the inference rules, and for evaluating the results of the semantic search. We have used protege editor of the ontology developing tool to design ontologies with test data. We also tested the designed ontology with the Inference Engine (Pellet) of protege editor. The generated reference rules were tested by TBox and SPARQL queries through STNet ontology. The results of test show that the generated reference rules were verified as true and STNet ontology were also evaluated to be useful for searching the complex combination of semantic relation.
This study describes the Bottom-up method for implementation of an ontology system from the RDB. The STNet, a structured terminology glossary based on RDB, was served as a test bed for converting to RDF ontology, for generating the inference rules, and for evaluating the results of the semantic search. We have used protege editor of the ontology developing tool to design ontologies with test data. We also tested the designed ontology with the Inference Engine (Pellet) of protege editor. The generated reference rules were tested by TBox and SPARQL queries through STNet ontology. The results of test show that the generated reference rules were verified as true and STNet ontology were also evaluated to be useful for searching the complex combination of semantic relation.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구는 한국학술지인용색인(Korea Citation Index, 이하 KCI)의 키워드를 기반으로 관계형 데이터베이스(Relational Database, 이하 RDB)로 구축된 인문학, 사회과학, 예술체육 분야의 구조적 학술용어사전인 ‘STNet(http://www.stnet.re.kr)’을 의미 검색이 가능한 지식베이스로 발전시키기 위해, STNet의 RDB 구조에서 추론 가능한 의미 규칙을 도출하여 온톨로지를 구축하고, 이를 STNet의 데이터 검색에 적용해 봄으로써 의미 검색 방식의 유용성을 평가하는 것을 목적으로 한다.
지금까지 수행된 연구들은 거의 대부분 구체적인 도메인의 온톨로지와 추론 규칙을 도출한 후 해당 구조에 맞춰 하향(Top-down) 방식으로 시스템을 구성하고 평가하는 방법론을 사용하였다. 본 연구는 이와 달리 이미 구축되어 있는 RDB 형식의 STNet을 테스트베드로 삼아 온톨로지 구조와 추론 규칙을 형성시킨 후 이를 STNet의 의미 검색에 적용해 보는 상향 (Bottom-up) 방식의 방법론을 제안하고 검증하고자 한다.
상향(bottom-up) 방식의 온톨로지 구조와 추론 규칙을 형성시킨 후 이를 의미 검색에 적용해 보고자 하는 연구의 목적에 따라 본 연구에서는, 2015년 7월 6일 현재 STNet에서 검수 작업이 완료된 전체 데이터의 객체값으로 정의된 개념속성 Y용어가 입력된 X용어의 클래스를, Y용어가 많이 입력된 상위 10개 순으로 과 같이 정리하였다.
이러한 작업을 수행한 이유는 각 개념속성이 갖는 Y용어 클래스의 종류가 1종에만 국한되지 않기 때문에 가장 많이 입력되는 Y용어 클래스를 중심으로 ‘X용어 클래스 ↔ Y용어 클래스’의 관계로 정리되는 추론 제한 규칙을 도출하기 위한 것이다.
본 연구의 목적은 KCI의 인문학, 사회과학, 예술체육 분야 학술 논문에 수록된 키워드를 대상으로 구축된 RDB 기반의 구조적 학술용어사전 “STNet”을 의미적 연관 검색에 활용이 가능한 지식베이스로 발전시키기 위해, RDB 구조에서 추론 가능한 규칙들을 도출하고 RDF로 변환하여 온톨로지를 구축한 후 해당 구조를 실제 STNet 데이터 검색에 적용함으로써 의미 검색의 유용성을 평가하는 것이다.
본 연구는 RDB 기반의 구조적학술용어사전 STNet을 의미 검색이 가능한 지식베이스로 발전시키는 과정에 있어서 ‘용어선정에 관한 연구 (고영만 외 2013)’, ‘텍사노미 구축에 관한 연구 (고영만, 김비연, 민혜령 2014)’, ‘관계유형에 관한 연구(고영만, 송민선, 이승준 2015)’, ‘RDF 온톨로지 변환 방식 연구(고영만, 이승준, 송민선 2015)’에 이어지는 다섯 번째 단계의 연구이다.
제안 방법
따라서 본 연구의 실험데이터가 되는 온톨로지 구축 대상은 ‘y01-01 실존인물’ 클래스에 할당된 용어 및 ‘y01-01 실존인물’ 클래스의 속성과 연결되어 있는 9개 클래스에 해당하는 용어이다. Protege를 이용해 온톨로지 구축 대상에 대한 RDF 온톨로지 구조를 정의하고 Protege의 Pellet 추론기를 통해 온톨로지 구조의 오류를 검증하였으며, 해당 온톨로지 구조를 STNet에 적용한 후 TBox 검증을 통해 추론 규칙의 오류를 검증하고 SPARQL 질의를 통해 검색 결과 값에 대한 평가를 실시 하였다.
본 연구의 절차는 크게 온톨로지 구조 생성과 검증, 실험 데이터의 RDF 온톨로지 변환 및 검증, 추론 제한규칙이 적용된 온톨로지에 대한 의미 검색 결과 평가의 세 단계로 구성된다.
RDF 온톨로지 변환기로는 데이터의 변형이 빈번하고 새로운 데이터의 추가나 데이터들 간의 연결관계가 지속적으로 변화하는 동적인 RDB에 적합한 것으로 평가된 D2RQ를 사용하였다(고영만, 이승준, 송민선 2015). 먼저 실험 데이터로부터 일부 샘플 데이터를 추출하여 RDF 온톨로지로 변환한 후 동일한 추론기를 통해 온톨로지 구조에 적용된 샘플 데이터의 오류를 검증하였다. 샘플 데이터에 대한 오류 검증과 수정 후, 실험 데이터인 STNet 데이터베이스의 ‘y01-01 실존 인물’ 클래스에 할당된 용어 및 ‘y01-01 실존 인물’ 클래스의 속성과 연결되어 있는 9개 클래스에 해당하는 용어, 9개 클래스의 속성과 연결되어 있는 용어를 RDF 온톨로지로 변환하여 반입하였다.
본 연구의 범위는 클래스와 클래스 속성 간의 관계이며, 클래스 속성은 온톨로지에서 ObjectType Property로 사용하는 용어형과 DataType Property로 사용하는 문자형, 숫자형, 날짜형 값으로 표현된다. 본 연구에서는 STNet의 클래스 속성 유형에 해당하는 용어, 문자, 숫자, 날짜형 모두를 온톨로지로 표현하여 의미검색을 위한 추론규칙 검증에 적용하였다.
그리고 가장 많은 개념속성 Y용어가 입력된 X용어 클래스 ‘y01-01 실존인물’을 온톨로지 구조의 가장 기본이 되는 중심 클래스로 삼았다.
STNet 온톨로지를 OWL-DL의 형태로 구성하였으며, ‘y01-01 실존인물’을 대상으로 관련 클래스들의 속성을 참조하여 ObjectType Property 56개와 DataType Property 15개를 정의하였다( 참조).
실험을 위해 ‘y01-01 실존인물’ 및 이 클래스에 속하는 속성값과 연결되는 9개 클래스를 1단계 연결 관계로 설정하고, 이후 9개 클래스의 개념 속성 중 추론 검증을 위해 의미적으로 반드시 포함되어야 할 2단계 연결고리 생성을 위해 연관 클래스들을 추가하였다([부록 1] 참조).
STNet 온톨로지를 OWL-DL의 형태로 구성하였으며, ‘y01-01 실존인물’을 대상으로 관련 클래스들의 속성을 참조하여 ObjectType Property 56개와 DataType Property 15개를 정의하였다(<그림 3> 참조). ObjectType Property 의 경우 역관계(InverseOf)를 설정하고 재귀호출구조(Reflexive)를 생성하였으며 클래스별 속성구조에 따라 Domain과 Range를 설정하였다. DataType Property의 경우 STNet의 텍스트와 코드 속성값을 참조하여 각 유형에 따라 String, DateTime, Integer의 Range를 부여하였다.
STNet 온톨로지가 OWL-DL의 형태로 구성되어 있으므로 Pellet 추론기를 통해 DL(Description Language, [부록 2] 참조)의 표현력 표현 규칙 ALCHIF(D)를 만족하는 클래스와 속성이 생성된 온톨로지 구조의 오류를 검증하였다.
개념적으로 문헌과 예술작품이 중복될 수 없으므로 상호간의 disjoint를 생성하여 구조적 오류를 수정하였으며, 이러한 과정을 거쳐 ‘y01-01 실존인물’ 클래스의 공리셋을 구축하였다( 참조).
추출된 데이터를 토대로 테스트 인스턴스를 생성하였으며, Pellet 추론기를 통해 데이터의 오류 여부를 검증하였다( 참조).
또한 D2RQ 매핑언어를 생성한 후 D2R 서버에서 제공 하는 d2r-query를 통해 해당 내용을 검증하여 오류를 확인하고 수정하였다.
실제 실험 데이터를 위한 일반화된 추론 제한 규칙 정의를 위해 에서 정리하였던 상위 10개 X용어 클래스를 대상으로 ‘X용어 클래스의 속성값으로 입력된 Y용어’를 ‘구축된 모든 X용어 클래스의 Null 값을 포함한 전체 속성 용어 수’로 나누어 “X용어 클래스의 속성별 입력 비율”을 산출하였다.
또한 속성에 40% 이상 데이터가 입력 되고 그 중 90% 이상의 입력 비율을 차지하는 Y용어 클래스를 기준으로 삼아 상대적으로 많은 비율이 입력된 경우를 대상으로 추론 제한 규칙을 정의하였다( 참조).
STNet의 실제 구축 데이터를 중심으로 입력된 값이 상대적으로 많은 비율을 계산하여, 상위 10위 X용어 클래스를 중심으로 ‘주어부(X용어 클래스) ↔ 술어부(속성) ↔ 목적어부(Y용어 클래스)’의 형식으로 추론 제한 규칙을 정리 하였다.
또한 각 속성에 대해 Y용어가 입력된 데이터를 대상으로, 각각의 Y용어가 어떤 클래스에 연결되는지의 구성 비율을 계산하였다.
본 연구에서 도출한 추론 규칙을 토대로 Protege에서 온톨로지 구조를 정리하고, 단순 키워드 검색만으로는 수행하기 힘든 검색 시나리오 여섯 개를 와 같이 설정하여 SPARQL 쿼리([부록 3] 참조)의 결과 값을 추출하였다.
ABox는 데이터의 인스턴스 박스에 해당하며, 정해진 규칙에 따라 TBox에서 정의된 각각의 클래스에 속하는 인스턴스를 생성한다. STNet 데이터베이스는 지금도 구축이 진행 중인 상태이며, 본연구를 위해 추출한 데이터도 STNet 전체 데이터의 일부분이므로 본 연구에서는 TBox 검증을 실시하였다.
그리고 의미적 연관 검색의 효용성을 평가해 보기 위해 STNet의 ‘y01-01 실존인물’ 클래스에서 속성으로 가장 많은 입력값들을 가진 상위 9개 클래스 및 해당 클래스들과 연결된 연관 클래스들을 분석하여 추론 제한 규칙과 검증에 필요한 시나리오를 설정한 후, TBox 검증과 SPARQL 질의에 의한 결과 값을 평가하였다.
이를 위해 먼저 STNet의 ‘y01-01 실존인물’ 클래스및 해당 클래스와 연관된 클래스들을 대상으로 Protege를 이용해 온톨로지 구조를 생성하고, STNet 시스템에 입력된 관계 구조를 토대로 각각의 연관 속성들을 정의하였다.
이를 위해 먼저 STNet의 ‘y01-01 실존인물’ 클래스및 해당 클래스와 연관된 클래스들을 대상으로 Protege를 이용해 온톨로지 구조를 생성하고, STNet 시스템에 입력된 관계 구조를 토대로 각각의 연관 속성들을 정의하였다. Pellet 추론기를 사용해 구성한 온톨로지 구조의 오류를 검증 하였으며, STNet에 입력된 실제 데이터를 가지고 실험을 위한 테스트 데이터를 구축하였다. 그리고 의미적 연관 검색의 효용성을 평가해 보기 위해 STNet의 ‘y01-01 실존인물’ 클래스에서 속성으로 가장 많은 입력값들을 가진 상위 9개 클래스 및 해당 클래스들과 연결된 연관 클래스들을 분석하여 추론 제한 규칙과 검증에 필요한 시나리오를 설정한 후, TBox 검증과 SPARQL 질의에 의한 결과 값을 평가하였다.
샘플 데이터에 대한 오류 검증과 수정 후, 실험 데이터인 STNet 데이터베이스의 ‘y01-01 실존 인물’ 클래스에 할당된 용어 및 ‘y01-01 실존 인물’ 클래스의 속성과 연결되어 있는 9개 클래스에 해당하는 용어, 9개 클래스의 속성과 연결되어 있는 용어를 RDF 온톨로지로 변환하여 반입하였다.
STNet의 RDB에 접속하여 변환하고자 하는 데이터를 정의하고 이에 대한 속성값을 설정한 후 D2RQ 형태로 변환된 스크립트를 통해 STNet 의 RDB 데이터를 RDF 데이터로 변환하였다(고영만, 이승준, 송민선 2015; 참조).
대상 데이터
본 연구는 STNet의 용어 간 관계 중에서 ‘X용어 ↔ Y용어’ 형태로 연결되는 Y용어가 개념속성 데이터로 가장 많이 연결되어 있는 ‘실존인물(코드명 y01-01)’ 클래스를 연구 대상으로 삼았다.
따라서 본 연구의 실험데이터가 되는 온톨로지 구축 대상은 ‘y01-01 실존인물’ 클래스에 할당된 용어 및 ‘y01-01 실존인물’ 클래스의 속성과 연결되어 있는 9개 클래스에 해당하는 용어이다.
하나는 클래스와 클래스 속성 간의 관계로서 하나의 용어와 그 용어가 속한 클래스의 속성값이 연결되는 관계이며, 다른 하나는 용어와 다른 용어 간에 맺어지는 관계이다. 본 연구의 범위는 클래스와 클래스 속성 간의 관계이며, 클래스 속성은 온톨로지에서 ObjectType Property로 사용하는 용어형과 DataType Property로 사용하는 문자형, 숫자형, 날짜형 값으로 표현된다. 본 연구에서는 STNet의 클래스 속성 유형에 해당하는 용어, 문자, 숫자, 날짜형 모두를 온톨로지로 표현하여 의미검색을 위한 추론규칙 검증에 적용하였다.
따라서 본 연구의 실험대상 용어는 온톨로지 구조의 중심 클래스로 설정한 ‘y01-01 실존인물’ 클래스 및 이 클래스의 속성과 연결되어 있는 9개 클래스에 해당하는 용어 총 13,005개이다( 참조).
온톨로지 클래스는 STNet의 텍사노미 구조를 참조하여 구성하였다. 실험을 위해 ‘y01-01 실존인물’ 및 이 클래스에 속하는 속성값과 연결되는 9개 클래스를 1단계 연결 관계로 설정하고, 이후 9개 클래스의 개념 속성 중 추론 검증을 위해 의미적으로 반드시 포함되어야 할 2단계 연결고리 생성을 위해 연관 클래스들을 추가하였다([부록 1] 참조).
온톨로지 구조 검증을 수행한 온톨로지 스키마에 실제 STNet의 인스턴스 데이터 중 ‘y01-01 실존인물’ 데이터와 ‘시대, 직업, 출생지, 국적, 저작’의 속성으로 입력된 데이터 중 사전 테스트를 위해 샘플 데이터를 추출하였다.
D2R서버(http://d2rq.org/)를 사용하여 RDB에 저장되어 있는 STNet의 실험 데이터를 RDF 온톨로지로 변환하였다. D2R 서버는 자체의 D2RQ 매핑 언어를 사용하여 응용 프로그램의 특정 데이터베이스 스키마와 RDFS, 또는 OWL 온톨로지 간에 매핑을 할 수 있도록 지원한다.
데이터처리
TBox 검증을 통해 온톨로지 구조와 인스턴스를 갖춘 전체 데이터에 대한 추론 규칙의 오류를 검증하였으며, 시나리오에 의한 SPARQL 질의를 통해 결과값에 대한 의미 검색의 유용성을 평가하였다( 참조).
이론/모형
추론기는 Tableaux 알고리즘을 기반으로 DIG 인터페이스를 지원하는 Description Logic 추론기인 ‘Pellet 추론기’를 사용하였다.
두 번째 단계는 구성된 온톨로지 구조의 논리적 오류가 없을 경우 STNet RDB 실험데이터를 RDF 온톨로지 변환기를 통해 RDF 데이터로 변환하는 단계이다. RDF 온톨로지 변환기로는 데이터의 변형이 빈번하고 새로운 데이터의 추가나 데이터들 간의 연결관계가 지속적으로 변화하는 동적인 RDB에 적합한 것으로 평가된 D2RQ를 사용하였다(고영만, 이승준, 송민선 2015). 먼저 실험 데이터로부터 일부 샘플 데이터를 추출하여 RDF 온톨로지로 변환한 후 동일한 추론기를 통해 온톨로지 구조에 적용된 샘플 데이터의 오류를 검증하였다.
온톨로지에서의 추론은 명제들을 기반으로 결론을 얻기 위한 일련의 프로세스를 구성하는 것으로, 결정가능성에 따라 Description Logic, Horn Logic, Frame Logic 등이 사용된다. STNet 온톨로지가 OWL-DL의 형태로 구성되어 있으므로 본 연구에서는 OWL-DL 기반 추론에 적합한 Description Logic을 사용하였다.
성능/효과
추론기를 통한 검증 결과 동일한 상위 클래 스를 지니는 ‘y02-01 문헌명’과 ‘y02-02 예술작 품명’ 클래스가 동일한 속성과 구조를 지니고 있어 두 클래스에 속한 데이터가 상호 호환될 수 있는 문제점이 발견되었다( 참조).
이때 X용어 클래스의 전체 속성 용어 수는 아무런 값도 입력되지 않는 경우(Null)와 Y용어가 입력된 경우를 모두 합산한 것이다. 계산식 적용 결과 상위 10위의 X용어 클래스 중 속성값이 가장 많이 입력된 비율은 92.5%, 가장 적게 입력된 비율은 0.04%로 나타났으며 전체 입력 비율의 평균값은 21.8%로 나타났다.
본 연구의 차별성은 의미 검색을 위한 추론 시스템에 관한 다른 연구들이 대부분 하향식 방법론을 취하고 있는 것과 달리 이미 구축되어 있는 RDB 기반 시스템인 STNet 구조를 바탕으로 온톨로지를 구성하고 추론 규칙을 형성하여 의미 검색에 적용하는 상향식 방법론을 제안했다는 점이다.
TBox 검증 결과 본 연구에서 생성한 ‘y01-01 실존인물’에 대한 추론 규칙의 서술 논리가 모두 참으로 나타났다, 기존 단순 키워드 검색만으로는 수행하기 힘든 검색 시나리오에 대한 SPARQL 질의에 대해서는 의미적으로 연관되는 값들이 조합된 검색 결과를 보여주는 것으로 평가되었다.
후속연구
다만 본 연구는 3단계 계층 구조로 나열된 150여개의 STNet 전체 텍사노미 클래스 중 입력 데이터 값이 가장 많이 몰려 있는 ‘y01-01 실존인물’과 연결된 주요 클래스들만을 대상으로 실험을 진행했기 때문에, 전체 STNet 구조에 대한 온톨로지를 구축하여 추론 규칙을 도출한 것은 아니라는 제한점을 가진다.
본 연구의 차별성은 의미 검색을 위한 추론 시스템에 관한 다른 연구들이 대부분 하향식 방법론을 취하고 있는 것과 달리 이미 구축되어 있는 RDB 기반 시스템인 STNet 구조를 바탕으로 온톨로지를 구성하고 추론 규칙을 형성하여 의미 검색에 적용하는 상향식 방법론을 제안했다는 점이다. 따라서 본 연구에서 제안한 방법론은 기존에 구축되어 있는 다양한 분야의 RDB 시스템들에 대해 의미 있는 추론 기능을 탑재할 수 있게 하는 하나의 이론적 토대가 될 수 있을 것이다. 다만 본 연구는 3단계 계층 구조로 나열된 150여개의 STNet 전체 텍사노미 클래스 중 입력 데이터 값이 가장 많이 몰려 있는 ‘y01-01 실존인물’과 연결된 주요 클래스들만을 대상으로 실험을 진행했기 때문에, 전체 STNet 구조에 대한 온톨로지를 구축하여 추론 규칙을 도출한 것은 아니라는 제한점을 가진다.
본 연구는 RDB 기반의 구조적학술용어사전 STNet을 의미 검색이 가능한 지식베이스로 발전시키는 과정에 있어서 ‘용어선정에 관한 연구 (고영만 외 2013)’, ‘텍사노미 구축에 관한 연구 (고영만, 김비연, 민혜령 2014)’, ‘관계유형에 관한 연구(고영만, 송민선, 이승준 2015)’, ‘RDF 온톨로지 변환 방식 연구(고영만, 이승준, 송민선 2015)’에 이어지는 다섯 번째 단계의 연구이다. 따라서 첫 번째 연구부터 본 연구까지의 연구 내용과 결과는 RDB 기반의 학술정보 데이터베이스를 의미검색이 가능한 지식베이스로 발전시키는 프로세스와 기술적 고려에 대한 지침이 될 수 있을 것이다. 또한 STNet에 구축되어 있는 수많은 학술용어 간 의미 구조는 특정 학술정보 시스템의 도메인과 특성에 맞추어 응용해서 사용할 수 있으며, 해당 시스템에 적합한 의미 추론 시스템을 개발하는 데 활용될 수 있을 것이다.
또한 STNet에 구축되어 있는 수많은 학술용어 간 의미 구조는 특정 학술정보 시스템의 도메인과 특성에 맞추어 응용해서 사용할 수 있으며, 해당 시스템에 적합한 의미 추론 시스템을 개발하는 데 활용될 수 있을 것이다.
또한 STNet에 구축되어 있는 수많은 학술용어 간 의미 구조는 특정 학술정보 시스템의 도메인과 특성에 맞추어 응용해서 사용할 수 있으며, 해당 시스템에 적합한 의미 추론 시스템을 개발하는 데 활용될 수 있을 것이다. 특히 STNet은 KCI의 저자키워드를 토대로 구축한 인문, 사회 및 체육, 예술 분야의 구조적 학술용어사전이므로, 본 연구 결과를 KCI에 적용시킬 경우 추론규칙에 의한 의미검색 결과값으로 제시된 용어들이 포함된 논문들을 검색하는 시스템 구축에 직접 활용될 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
ABox란?
TBox는 데이터의 스키마 박스라 할 수 있으며, 클래스를 정의하고 ObjectType Property 와 DataType Property를 통해 클래스와 클래스 사이에 존재하는 관계 유형을 정의한다. ABox는 데이터의 인스턴스 박스에 해당하며, 정해진 규칙에 따라 TBox에서 정의된 각각의 클래스에 속하는 인스턴스를 생성한다. STNet 데이터베이스는 지금도 구축이 진행 중인 상태이며, 본연구를 위해 추출한 데이터도 STNet 전체 데이터의 일부분이므로 본 연구에서는 TBox 검증을 실시하였다.
STNet의 용어 간 의미 관계는 어떻게 나누어지는가?
STNet의 용어 간 의미 관계는 크게 두 종류로 나누어진다. 하나는 클래스와 클래스 속성 간의 관계로서 하나의 용어와 그 용어가 속한 클래스의 속성값이 연결되는 관계이며, 다른 하나는 용어와 다른 용어 간에 맺어지는 관계이다. 본 연구의 범위는 클래스와 클래스 속성 간의 관계이며, 클래스 속성은 온톨로지에서 ObjectType Property로 사용하는 용어형과 DataType Property로 사용하는 문자형, 숫자형, 날짜형 값으로 표현된다.
구조적 학술용어사전이란?
본 연구에서 말하는 “구조적 학술용어사전” 이란 새로운 형식의 지식조직체계의 하나로서, 학술 용어를 유사한 속성을 가진 개념범주(이하 클래스)에 따라 분류하고, 그 클래스가 가지는 속성을 체계화한 다음, 그 속성에 따라 해당 학술 용어 하나하나의 의미를 정의하는 학술용어사전을 말한다. 구조적 학술용어사전에서 동일한 클래스에 속하는 학술용어는 해당 클래스의 개념속성과 관계속성을 통해 정의된다.
참고문헌 (22)
강현민. 2010. RDF/OWL의 객체속성을 이용한 관계온톨로지 시스템 구축과 활용에 관한 연구. 정보관리학회지, 27(4): 219-237.(Kang, Hyen-Min. 2010. "A Study on Implementation and Applying Relationship Ontology System Using RDF/OWL Object Property." Journal of the Korean Society for Information Management, 27(4): 219-237.)
고영만. 2006. 시소러스 기반 온톨로지에 관한 연구. 정보관리학회지, 5: 5-22.(Ko, Young Man. 2006. "A Study on the Ontology based on Thesaurus." Information Management, 5: 5-22.)
고영만, 송인석. 2011. 연구문헌의 지식구조를 반영하는 의미기반의 지식조직체계에 관한 연구. 정보관리학회지, 28(1): 145-170.(Ko, Young Man and Song, Inseok. 2011. "A Study on the Knowledge Organizing System of Research Papers Based on Semantic Relation of the Knowledge Structure." Journal of the Korean Society for Information Management, 28(1): 145-170.)
고영만 외. 2013. 인문학 및 사회과학 분야 국내 학술논문의 저자키워드 출현빈도와 피인용횟수의 상관관계 연구. 정보관리학회지, 30(2): 227-243.(Ko, Young Man et al. 2013. "A Study on the Correlation between the Appearance Frequency of Author Keyword and the Number of Citation in the Humanities and Social Science Journal Articles of the Korea Citation Index (KCI)." Journal of the Korean Society for Information Management, 30(2): 227-243.)
고영만, 김비연, 민혜령. 2014. 한국학술지인용색인(KCI)의 인문학, 사회과학, 예술체육 분야 저자 키워드의 의미적, 형태적 분석에 의한 개념범주 텍사노미 연구. 한국문헌정보학회지, 48(4): 297-322.(Ko, Young Man, Kim, Bee-Yeon and Min, Hye-Ryoung. 2014. "A Study on a Conceptual Taxonomy of Author Keywords of Humanities, Social Sciences, and Art and Sport in the Korea Citation Index (KCI) by Analysis of its Meaning and Lexical Morpheme." Journal of the Korean Society for Library and Information Science, 48(4): 297-322.)
고영만, 송민선, 이승준. 2015. 한국학술지인용색인(KCI)의 인문학, 사회과학, 예술체육 분야 저자 키워드의 의미적 관계 유형 최적화 연구. 한국문헌정보학회지, 49(1): 45-67.(Ko, Young Man, Song, Min-Sun and Lee, Seung-Jun. 2015. "A Study on the Optimization of Semantic Relation of Author Keywords in Humanities, Social Sciences, and Art and Sprot of the Korea Citation Index (KCI)." Journal of the Korean Society for Library and Information Science, 49(1): 45-67.)
고영만, 이승준, 송민선. 2015. 관계형 데이터베이스 기반 구조적학술용어사전(STNet)의 RDF 온톨로지 변환 방식 연구. 정보관리학회지, 32(2): 131-151.(Ko, Young Man, Lee, Seung-Jun and Song, Min-Sun. 2015. "A Study on Conversion Methods for Generating RDF Ontology from Structural Terminology Net (STNet) based on RDB." Journal of the Korean Society for Information Management, 32(2): 131-151.)
김상균 외. 2008. 한국한의학연구원 소셜 네트워크 온톨로지 구축. 한국콘텐츠학회논문지, 9(12): 485-495.(Kim, Sang-Kyun et al. 2008. "Construction of Social Network Ontology in Korea Institute of Oriental Medicine." Journal of the Korea Contents Association, 9(12): 485-495.)
김수경, 안기홍. 2007. 지능형 이미지 검색 시스템을 위한 추론 기반의 웹 온톨로지 구축. 정보관리학회지, 24(3): 119-147.(Kim, Su-Kyung and Ahn, Kee-Hong. 2007. "Web Ontology Modeling Based on Description Logic and SWRL." Journal of the Korean Society for Information Management, 24(3): 119-147.)
김재훈, 박석. 2011. OWLJessKB 추론 규칙을 바탕으로 한 subClassOf 추론에서의 그래프 레이블링 효율성 재평가. 정보과학회논문지: 데이타베이스, 38(4): 238-247.(Kim, Jaehoon and Park, Seog. 2011. "An Efficiency Revaluation of Graph Labeling for subClassOf Inference based on OWLJessKB Inference Rules." Journal of Korea Institute of Information Scientists and Engineers: Database, 38(4): 238-247.)
김진성. 2003. 데이터마이닝과 사례기반추론 기법에 기반한 인터넷 구매지원 시스템 구축에 관한 연구. 한국경영과학회지, 28(3): 135-148.(Kim, Jin Sung. 2003. "A Study on the Development of Internet Purchase Support Systems Based on Data Mining and Case-Based Reasoning." Journal of the Korean Operations Research and Management Science Society, 28(3): 135-148.)
김현희, 안태경. 2003. 온톨로지를 이용한 인터넷웹 검색에 관한 실험적 연구. 정보관리학회지, 20(1): 417-455.(Kim, Hyun-Hee and Ahn, Tae-Kyung. 2003. "An Experimental Study on the Internet Web Retrieval Using Ontologies." Journal of the Korean Society for Information Management, 20(1): 417-455.)
박길식, 박성철, 김준태. 2012. 온톨로지 기반 Jess 추론 규칙을 이용한 자동차 정비 이-트레이닝 시스템에 대한 연구. 한국컴퓨터종합학술대회 논문집, 39(1(B)): 417-419.(Park, GilSik, Park, SungChul and Kim, JunTae. 2012. "The Study about Ontology based e-training System for Automobile Maintenance Education using Jess Inference Rule." Proceedings of Korea Computer Congress 2012, 39(1(B)): 417-419.)
송우종, 김유성. 2008. Wine 온톨로지와 추론엔진 Jena를 활용한 의미추론 기반의 Wine정보검색시스템. [online] [cited 2015. 7. 10.] (Song, Woojong and Kim, Yusung. 2008. "A Reasoning based Wine Information Searching System with Wine Ontology and Reasoning Engine Jena." [online] [cited 2015. 7. 10.] )
송인석. 2008. 연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구. 정보관리연구, 39(4): 121-154.(Song, In-Seok. 2008. "A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval." Journal of Information Management, 39(4): 121-154.)
이태영. 2009. 시맨틱 웹 환경에서 적합한 문장을 제공하는 이야기 쓰기 도우미에 관한 연구. 정보관리학회지, 26(4): 7-33.(Lee, Tae-young. 2009. "A Study on Retrieval Model Providing Relevant Sentences in Storytelling on Semantic Web." Journal of the Korean Society for Information Management, 26(4): 7-33.)
장창복, 김만재, 최의인. 2012. 상황 인식 추천 서비스를 위한 온톨로지 이용 OWL 모델링. 한국인터넷방송통신학회 논문지, 12(1): 265-273.(Chang, Changbok, Kim, Manjae and Choi, Euiin. 2012. "OWL Modeling using Ontology for Context Aware Recommendation Service." The Journal of the Institute of Internet, Broadcasting and Communication, 12(1): 265-273.)
정상원. 2009. 과학기술 컨퍼런스 정보의 반자동 수집 및 학술적 의미추론 시스템 연구개발. 대전: 한국연구재단, H00001(100917).(Jeong, Senator. 2009. Semi-Automatic crawling of Conference data and Inferring of Scholarly meaing. Daejeon: National Research Foundation of Korea. H00001(100917).)
최정화, 박영택. 2010. 온톨로지 Open World 추론과 규칙 Closed World 추론의 통합. 정보과학회논문지: 소프트웨어 및 응용, 37(4): 282-295.(Choi, Jung-Hwa and Park, Young-Taek. 2010. "Integration of Ontology Open-World and Rule Closed-World Reasoning." Journal of Korea Institute of Information Scientists and Engineers: Software and Applications, 37(4): 282-295.)
허정환 외. 2008. 의미추론규칙을 이용한 온톨로지 기반의 전자우편 자동 분류 시스템. 한국정보과학회 2008 가을 학술발표논문집, 35(2(C)): 234-239.(Heu, Chung-Hwan et al. 2008. "Ontology-based E-mail Classification System using Semantic Inference Rules." Proceedings of Korea Information Science Society 2008 Fall Conference, 35(2(C)): 234-239.)
Horridge, M., Parsia, B. and Sattler, U. 2009. "Explaining Inconsistencies in OWL Ontologies." Lecture Notes in Computer Science, 5785: 124-137.
Sirin, E. et al. 2007. "Pellet: A Practical OWL-DL Reasoner." Journal of Web Semantics: Science, Services and Agents on the World Wide Web, 5(2): 51-53.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.