본 논문에서는 분야 온톨로지 구축을 위하여 분야 상위 온톨로지를 구축한 다음, 분야 시소러스의 개념과 관계를 이용하여 분야 상위 온톨로지를 확장하는 방법을 제안한다. 이를 위하여 우선 일반분야 시소러스와 분야 사전을 이용하여 분야 상위 개념 분류체계를 구축한다. 다음, 분야 시소러스의 개념을 분야 상위 온톨로지의 상위 개념으로 분류하고, 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT) 사이의 관계를 분야 상위 온톨로지에서 정의한 의미관계로 분류한다. 개념 분류는 두 단계로 진행되는데, 1단계에서는 빈도수 기반 방법, 2단계에서는 유사도 기반방법을 적용하여 시소러스 개념을 분야 상위 온톨로지의 개념으로 분류한다. 관계 분류에서는 두 가지 방법을 적용하였는데, (i) 훈련데이타가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 iso와 기타 관계(non-isa관계)로 분류하고, 다시 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ii) 훈련데이타를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 특징기반 분류 기법을 사용하되, k-Nearest Neighbors(k-NN)방법으로 훈련데이타를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과 사람에 의한 판단 결과와 비교 가능한 성능을 보여 주었다.
본 논문에서는 분야 온톨로지 구축을 위하여 분야 상위 온톨로지를 구축한 다음, 분야 시소러스의 개념과 관계를 이용하여 분야 상위 온톨로지를 확장하는 방법을 제안한다. 이를 위하여 우선 일반분야 시소러스와 분야 사전을 이용하여 분야 상위 개념 분류체계를 구축한다. 다음, 분야 시소러스의 개념을 분야 상위 온톨로지의 상위 개념으로 분류하고, 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT) 사이의 관계를 분야 상위 온톨로지에서 정의한 의미관계로 분류한다. 개념 분류는 두 단계로 진행되는데, 1단계에서는 빈도수 기반 방법, 2단계에서는 유사도 기반방법을 적용하여 시소러스 개념을 분야 상위 온톨로지의 개념으로 분류한다. 관계 분류에서는 두 가지 방법을 적용하였는데, (i) 훈련데이타가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 iso와 기타 관계(non-isa관계)로 분류하고, 다시 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ii) 훈련데이타를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 특징기반 분류 기법을 사용하되, k-Nearest Neighbors(k-NN)방법으로 훈련데이타를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과 사람에 의한 판단 결과와 비교 가능한 성능을 보여 주었다.
For the purpose of building domain ontology, this paper proposes a methodology for building core ontology first, and then enriching the core ontology with the concepts and relations in the domain thesaurus. First, the top-level concept taxonomy of the core ontology is built using domain dictionary a...
For the purpose of building domain ontology, this paper proposes a methodology for building core ontology first, and then enriching the core ontology with the concepts and relations in the domain thesaurus. First, the top-level concept taxonomy of the core ontology is built using domain dictionary and general domain thesaurus. Then, the concepts of the domain thesaurus are classified into top-level concepts in the core ontology, and relations between broader terms (BT) - narrower terms (NT) and related terms (RT) are classified into semantic relations defined for the core ontology. To classify concepts, a two-step approach is adopted, in which a frequency-based approach is complemented with a similarity-based approach. To classify relations, two techniques are applied: (i) for the case of insufficient training data, a rule-based module is for identifying isa relation out of non-isa ones; a pattern-based approach is for classifying non-taxonomic semantic relations from non-isa. (ii) For the case of sufficient training data, a maximum-entropy model is adopted in the feature-based classification, where k-NN approach is for noisy filtering of training data. A series of experiments show that performances of the proposed systems are quite promising and comparable to judgments by human experts.
For the purpose of building domain ontology, this paper proposes a methodology for building core ontology first, and then enriching the core ontology with the concepts and relations in the domain thesaurus. First, the top-level concept taxonomy of the core ontology is built using domain dictionary and general domain thesaurus. Then, the concepts of the domain thesaurus are classified into top-level concepts in the core ontology, and relations between broader terms (BT) - narrower terms (NT) and related terms (RT) are classified into semantic relations defined for the core ontology. To classify concepts, a two-step approach is adopted, in which a frequency-based approach is complemented with a similarity-based approach. To classify relations, two techniques are applied: (i) for the case of insufficient training data, a rule-based module is for identifying isa relation out of non-isa ones; a pattern-based approach is for classifying non-taxonomic semantic relations from non-isa. (ii) For the case of sufficient training data, a maximum-entropy model is adopted in the feature-based classification, where k-NN approach is for noisy filtering of training data. A series of experiments show that performances of the proposed systems are quite promising and comparable to judgments by human experts.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이런 정보는 온톨로지를 구성하는 가장 기본적인 정보이기어〕, 시소러스를 이용하여 온톨로지를 구축할 수 있다[3AL 시소러스와 온톨로지는 모두 개념과 관계 정보를 가지고 있지만, 시소러스의 관계는 주로 상하위 관계와 동의/유의 관계* 부분 전체 관계로 국한되어 있고, 기타관계를 가지고 있더라도 세분화하지 않고 BT-NT/KT 관계로만 표현한다[3, 5-7丄 예를 들면, 분야 시소러스인 bispe시}⑸의 계층체계에는 i&z 관계와 non ”관계가 혼재하여 있는데, 예를 들면 그림 1에서 "SCADA sys- 坨ms"와 r/Data acquisition^ 사이는 mm-切관계 임에도 불구하고 i皿 콴계 와 똑 같이 표현된다.간계로 구성된 엄격한 상하위 계층체계(taxonomic hierarchy)와 구별하기 위하여, 본 논문에서는 분야 시소러스의 이러한 계층체계를 BT-N17RT계층체계라고 부르기로 한다, 시소러스가 지식 표현 자체에 a 목적을 두고 있다면, 온톨로지는 자동추론을 최종 목적으로 하고 있기에, 엄격한 상하위 관계(怂Z 관계)와 세분화된 관계 정보로 개념의 속성을 나타낸다. 예를 들면 동물 온톨로지에서는 동물의 식성을 표현하기 위하여 "估라는 관계가 필요하고, 피자 온톨로지에서는 피자의 토핑과 산지 속성을 나타내기 위하여 h蓝 To】項 mg 과 has Country Of Origin 세분화된 관계를 사용한다[8L
관계 분류 후 BT와 RT가 상위어 없이 최상위 개념으로 남는 것을 방지하기 위하여, 본 논문에서는 개념분류를 통하여 이들 용어를 분야 상위 온톨로지의 개념 (의미 키테고리)으로 분류한다. 이러한 개념 및 관계 분류를 .
그러나 본 과제의 연구대상인 IT 분야와 Inspec 시소러스는 기존의 연구들보다 포괄적인 분야를 다루기 때문에, 패턴을 수동적으로 정의하기엔 어려움이 있다. 이 문제를 해결하기 위하여본 논문에서는 규칙과 패턴기반 관계 분류 외에 지도식 관계 분류 방법을 제안하였다. 본 과제가 이런 기존 연구와의 또 다른 차이점은, 본 논문에서는 관계 분류뿐만 아니라, 개념 분류도 수행하여, 분야 시소러스의 BT- NT/令T계층을 분야 온톨로지를 위한 상하위 계층으로 변환시키고 있다.
가설 설정
【로 IT 분야 용어를, 4 로 f 의 중심 어를 표시 하고, 而 가 가지고 있는 m개의 의미는 CoreNet 개념 化i, …<九… CnJ 에 각각 대응된다고 가정한다. 중심어 &가 개념로 개념분류(의미태깅)되는 확률을 PHgI 相로 표시하면, IT 분야에서 용어 f 의 상위 개념 G 는 식 (1)에 의하여 분류된다.
분류한다. t 로 Inspec 용어를, ht 로 f의 중심어를 표시하고, ht m개의 CoreNet 개념에 대응된다고 가정한다. ⑰로 q의 IT분야 보편성 점수를 나타내면, IT분야에서 t의 개념 c느 식 (2)에 의하여 분류된다:
.Isa 특징: 규칙기반 방법으로 isa로 분류되는가? 개념 특징은 패턴기반 분류에서 사용한 특징을 반영한 것이고, 반면 isa 특징은 규칙기반 방법의 판단 결과를 직접 사용하는 것이다.
제안 방법
본 논문에서의 접근 방법은, 그림 2와 3이 보여 주는 바와 같이, 우선 분야 상위 온톨로지를 구축한 다음(D), 분-야 시소러스에 대하여 개념 분류(B5C, D) 및 관계 분류(A;B)를 수행함으로써 분야 상위 온톨로지를 확장하는 것이다. 용어의 개념 정보는 관계 분류에도 도움 되기에, 우선 용어의 개념을 분류한 다음, 용어간 관계를 분류하기로 한다.
이를 이용하여 분야 상위 온톨로지를 확장하기 위하여, 분야 상위 온톨로지의 개념을 의미 카 .테고리로 간주하고, 빈도수 및 유사도 기반의 개념 분류 방법에 의하여 Inspec용어를 분야 상위 온톨로지 개념으로 분류한다. 또한 Inspec 시소러스의 BT-NT/RT 관계를 분야 상위 온톨로지의 특정 의미관계로 분류하기 위하여 우선 훈련데이타가 부족한 경우를 위한 규칙 및 패턴 기반 방법을 제안하였고, 충분한 훈련데이타를 확보한 후에는 MEM및 k-NN기법을 이용한 특징기반 관계분류기법을 사용하되, 그 특징 정보로 규칙 및 패턴 기반 관계 분류에서 사용한 어휘 및 개념 정보를 사용하였다.
테고리로 간주하고, 빈도수 및 유사도 기반의 개념 분류 방법에 의하여 Inspec용어를 분야 상위 온톨로지 개념으로 분류한다. 또한 Inspec 시소러스의 BT-NT/RT 관계를 분야 상위 온톨로지의 특정 의미관계로 분류하기 위하여 우선 훈련데이타가 부족한 경우를 위한 규칙 및 패턴 기반 방법을 제안하였고, 충분한 훈련데이타를 확보한 후에는 MEM및 k-NN기법을 이용한 특징기반 관계분류기법을 사용하되, 그 특징 정보로 규칙 및 패턴 기반 관계 분류에서 사용한 어휘 및 개념 정보를 사용하였다.
첫째는 기존 지식베이스를 온톨로지 포맷으로 변환하는 것인데H6], 새로운 온톨로지 지식의 생성이 없이, 기존의 시소러스 포맷을 RDF나 OWL과 같은 온톨로지 표현들로 변환한다. 이런 연구에서는 각각의 시소러스 표현 방식에 대하여 조사 연구 후, 이를 패턴기반이나 규칙기반 방법으로 온톨로지 포맷으로 변환한다. 둘째는 기존 지식 베이스로부터 유용한 정보를 추출하여 온톨로지 지식으로 변환하는 것 인데[14, 17-19], 예를 들면 기존의 논리 프로그램으로부터 제약 조건을 추출하여 온톨로지 지식으로 변환해 주기도 한다.
분야 상위 온톨로지를 우선 구축한 다음 이를 이용하여 분야 온톨로지를 자동으로 구축하는 측면에서 본 연구는 이런 연구들과 유사하다[10T2, 21, 22], 다만 분야 상위 온톨로지 구축 방법으로, 본 연구에서는 일반 분야 시소러스와 분야 사전을 이용하여 IT분야 상위 개념 체계를 자동으로 구축하였다. 한편, 관계 분류를 통하여분야 시소러스로 분야 온톨로지를 구축하는 면에서, 본 논문은 [6, 기의 연구와 유사하다.
이 문제를 해결하기 위하여본 논문에서는 규칙과 패턴기반 관계 분류 외에 지도식 관계 분류 방법을 제안하였다. 본 과제가 이런 기존 연구와의 또 다른 차이점은, 본 논문에서는 관계 분류뿐만 아니라, 개념 분류도 수행하여, 분야 시소러스의 BT- NT/令T계층을 분야 온톨로지를 위한 상하위 계층으로 변환시키고 있다.
본 연구에서 IT분야 상위 개념을 일반성’ 보편성, 구체성의 세 가지 기준에 근거하여 선정한다.
한다. 일반성 기준을 따르기 위하여, IT분야 상위개념을 “전기기기”와 같이 일반 분야 시소러스에도 포함된 개념 중에서 선정하였다.
본 연구에서는 개념 분류를 통하여 대용량 IT분야 전문용어 사전硏 13]의 한국어 용어를 일반 분야 시소러스 CoreNet3)[27]의 개념으로 매핑한 후, 각 개념으로 매핑된 IT분야 용어수로 IT분야에서 해당 개념의 보편성 점수를 계산하였다. CoreNet 은 2, 900 여 개의 개념(카테고리) 과 50, 000 여 개의 한국어 상용어휘를 가지고 있는 일반분야 시소러스이다.
본 논문에서느 Inspec 용어에 대한 분류 대신 용어의 중심어에 대한 분류를 수행하였는데, 중심어 인식은 다음의 패턴을 적용하여 수행하였다.
설명하고자 한다. 관계 분류에서, 훈련데이타가부족할 경우 규칙 및 패턴기반 방법을 사용하였고, 훈련데이타가 어느 정도 축적된 후에는 지도식 방법을 도입하였다・
규칙 및 패턴기반 관계 분류에서는 우선 규칙기반 방법으로, BT-NT관계를 谕관계와 mm-该관계로 분류하였다[15L 그 다음, 위의 과정에서 m羽-怂a 관계로 분류된 관계들을 패턴기반 방법으로 온톨로지를 위한 의미 관계로 분류한다. 서술의 간략함을 위하여 본 논문에서는 BT-NT/RT관계는 如川(NT, BT)로, 诂。관계는 isa (NT, BT屋, ziorEsa 관계는 n~isa (NT, BT)로 표기하기로 한다.
분야 시소러스가 제공하는 BT-NT/RT 관계에서의 용어 쌍이 실제 같은 문장에 나타나는 용례를 찾기 어려웠고, 문맥 정보를 포함한 훈련데이타의 구축이 어려웠기여L 본 연구에서는 규칙 및 패턴 기반 방법에서 사용하였던 어휘 정보를 특징으로 활용하였다 본 연구에서 사용한 기본 특징 정보는 다음곽 같다:. .
적용률(coverage)과 정확도(accuracy)를 평가의 척도로 사용하였다. 적용률은 얼마나 많은 용어가 분야 상위개념으로 분류되는지를 평가하기 위하여 사용되며(식 (5)), 정확도는 얼마나 많은 용어가 정확하게 분류되는지를 평가하기 위한 것이다(식 (6)).
관계 분류에서 개념 분류 결과를 사용하는데, 위에서 언급한 180개의 중심어에 대해서는 사람의 수정을 거친 개념 분류 결과를 적용하였고, 기타 중심어는 자동 개념분류 결과를 적용하였다.
본 실험에서는 우선 자동 분류의 정확도를 평가한 다음, 이를 수동 분류의 일관성과 비교 평가하였다.
자동 분류의 정확도에 대한 평가 실험에서, Inspec 시소러스의 12, 821개 BT-NT/RT 관계를 5.1 절에서 설명한 규칙 기반 방법으로 isa 관계와 non-isa 관계로 분류하였다. 본 실험에서는 모든 분류 대상에 대하여 관계분류를 수행하였기에, 관계 분류의 적용률은 100%이다.
실험데이타에서 诅。관계의 비례와 동일하다. 5.1 절에서 제안한 규칙을 평가하기 위하여 규칙을 순차적으로 적용하면서 정확도를 평가하였다(표 2).
자동 분류 정확도를 수동 분류 일관성과 비교하기 위하여, 두 사람이 같은 분류 대상에 대하여 동시에 분류하되, 결과가 같은 경우를 정답으로 간주하여 평가하였다. 위의 12, 821개 BT-NT/RT관계 중 임의로 선택된 675개의 관계에 대한 분류 평가 결과, 수동 분류의 일관성은 82.
이런 낮은 정확도의 원인을 찾기 위하여 수동 분류 일관성 평가를 수행하였다. 일관성 평가는 식 (6)올 따르되.
본 논문에서는 분야 상위 온톨로지를 구죽한 다음, 분야 시소러스의 개념과 관계에 대한 분류를 통하여 분야 상위 온톨로지를 확장함으로, 최종적으로 분야 온톨로지를 구축하는 방법을 제안하였다 분야 상위 온톨로지는 일반 분야 시소러스와 특정 분야 용어 사전을 이용하여 구축하였다. 분야 시소러스의 용어와 개념을 분야 상위온톨로지 의 개념으로 분류하고, 시소러스에서의 BT … NT/RT관계는 분야 상위 온톨로지에서 정의한 의미 관계로 분류하였다.
분야 시소러스의 용어와 개념을 분야 상위온톨로지 의 개념으로 분류하고, 시소러스에서의 BT … NT/RT관계는 분야 상위 온톨로지에서 정의한 의미 관계로 분류하였다. 개념 분류에서는 유사도와 통계 기반 방법을 적용하였고, 관계 분류에서는 훈련데이타가 부족한 경우를 위하여 먼저 규칙기반 방법으로 BT-NT/RT 관계를 와 non~isa 판계로 분류한 다음 패턴기반 방법으로 non-isa 관계를 온톨로지를 위한 의미관계로 분류하였다.
분야 시소러스의 용어와 개념을 분야 상위온톨로지 의 개념으로 분류하고, 시소러스에서의 BT … NT/RT관계는 분야 상위 온톨로지에서 정의한 의미 관계로 분류하였다. 개념 분류에서는 유사도와 통계 기반 방법을 적용하였고, 관계 분류에서는 훈련데이타가 부족한 경우를 위하여 먼저 규칙기반 방법으로 BT-NT/RT 관계를 와 non~isa 판계로 분류한 다음 패턴기반 방법으로 non-isa 관계를 온톨로지를 위한 의미관계로 분류하였다. 또한 훈련데이타를 충분히 축적한 경우를 위하여 어휘정보를 활용한 특징기반 의미관계 분류기법을 제안하였는데, k〜NN기법으로 훈련데 이타를 정제함으로 분류 정확도를 향상시켰다.
또한 훈련데이타를 충분히 축적한 경우를 위하여 어휘정보를 활용한 특징기반 의미관계 분류기법을 제안하였는데, k〜NN기법으로 훈련데 이타를 정제함으로 분류 정확도를 향상시켰다. 본 논문에서 제안한 방법으로 시스템을 구축하였는데, 그 성능이 사람에 의한 판단 결과와 견줄만한 수준이었다.
개념 분류에서는 유사도와 통계 기반 방법을 적용하였고, 관계 분류에서는 훈련데이타가 부족한 경우를 위하여 먼저 규칙기반 방법으로 BT-NT/RT 관계를 와 non~isa 판계로 분류한 다음 패턴기반 방법으로 non-isa 관계를 온톨로지를 위한 의미관계로 분류하였다. 또한 훈련데이타를 충분히 축적한 경우를 위하여 어휘정보를 활용한 특징기반 의미관계 분류기법을 제안하였는데, k〜NN기법으로 훈련데 이타를 정제함으로 분류 정확도를 향상시켰다. 본 논문에서 제안한 방법으로 시스템을 구축하였는데, 그 성능이 사람에 의한 판단 결과와 견줄만한 수준이었다.
대상 데이터
위의 세가지 기준에 근거하여 IT분야 상위 개념을 성정하였는데, 우선 2, 900여 개의 CoreNet 개념 중 800여 개의 개념을 자동으로 선택한 다음, 이 중에서 전문가가 200개의 개념을 최종으로 선정하였다.
이론/모형
선정하는 방법이다. 유사 이벤트 추출을 위하여 코사인 유사도 방법을 사용하였는데, 유사도 계산에서도 위에서 제안한 특징 정보를 이용하였다.
성능/효과
본 논문의 작성 당시, IT 분야 상위 온톨로지는 총 185개의 의미관계 유형을 가지고 있었고, 이 중 108개의 의미관계 유형에 대하여 258개의 관계 트리플이 정의되어 있었다. 이런 의미관계는 온톨로지 개발자가 정의하였다.
용어가 속한 개념은 중심어가 속한 개념과 같다는 가정하에, 22만개의 용어를 가진 IT 분야 전문용어 사전 [13]에서 빈도수가 가장 높은 180개의 중심어를 평가데이타로 사용하였다 이 실험에서 78%의 적용률과 81%의 정확도를 얻을 수 있었다.
1 절에서 설명한 규칙 기반 방법으로 isa 관계와 non-isa 관계로 분류하였다. 본 실험에서는 모든 분류 대상에 대하여 관계분류를 수행하였기에, 관계 분류의 적용률은 100%이다. 자동 분류의 정확도는 사람이 평가하는데 식 (6)에서 “용어 수”대신 “관계 수”를 대입하였다.
표 2에서 볼 수 있는 바와 같이, 규칙 기반 isa 관계분류 방법으로 베이스라인보다 약 7.8%의 정확도 향상이 가능하였다. 본 논문에서 제안한 규칙 중, 중심어의 관계 이행 규칙이 많은 역할을 하지 못하였는데(결과 3 과 2를 비교), 그 원인은 본 실험에서 중심어 사이의 isa 관계는 사람이 부분 데이타에 대한 관찰을 통하여 추가한 것으로, 해당 중심어 수는 92개 밖에 안되기에, 전체 데이타에서의 적용률이 낮았기 때문이다.
위의 12, 821개 BT-NT/RT관계 중 임의로 선택된 675개의 관계에 대한 분류 평가 결과, 수동 분류의 일관성은 82.49%였다 이는 표 2에서의 자동 분류 정확도 82.02%보다 미약하게 높은 수준이었다.
다만 두 실험의 데이타가 서로 다르기 때문에 직접 비교를 위하여, 위 675개 관계에 대한 자동 분류의 정확도를 따로 평가한 결과, 그 정확도는 83.41%로, 사람에 의한 분류 일관성보다 오히려 조금 높은 수준을 보여주었다. 분류 실험에 참여한 전문가가 해당 실험을 수행할 때까지 약 2-3개월간 관계 분류 작업을 수행하였으며, 각기 4, 000 〜5, 000개의 관계를 분류한 경험이 있었는데, 분류 참여자의 경험이 아직 많지 않아 분류 일관성에 영향을 주었던 것 같다 또 다른 원인은, 자동 분류는 같은 규칙을 적용 시 늘 일관된 결과를 제공하는 반면, 수동 분류는 많은 훈련을 거친 전문가더라도 여전히 때와 분류대상에 따라 그 일관성이 영향 받기 때문인것으로 간주된다.
Inspec 시소러스의 BT-NT/RT관계 12, 821개에 대하여 isa 관계 분류를 수행하고 사람이 1T차례 검수한 결과, 최종적으로 3, 307개의 non-isa 관계를 얻을 수 있었다. 이 3.
이 3.3。7개의 non-isa 관계에 대하여 패턴기반 방법으로 의미관계 분류률 수행하였는데, 3L09%의 적용률과 약 90%의 정확도를 얻을 수 있었다. 제3장에서 설명하였듯이, 본 실험에서 시용한 패턴은 108개 관계 유형에 대한 258개의 관계 트리플인데, 이는 패턴기반 관계 분류의 목芸 카테고리 수가 108개임을 뜻한다,
볼 수 얏}다. 표 3의 결과 3(기본 특징 + 개념 특징어] 대하여 분석한 결과, 이 중 双/관계 분류의 정확도는 89.58%인 반면, 기타 의미관계의 정확도는 24.19% 밖에 되지 않았다. 이를 패턴기반 방법의 90%에 달하는 정확도와 비교할 때, 패턴기반 방법에서의 목표 카테고리 수가 108개로서 지도식 방법에서의 목표 카테고리 수 1明개 보다 현저히 적은 점을 고려하더라도, 여전히 낮다고 할 수 있다.
후속연구
특징이다. 나머지 특징들은 규칙기반 방법으로와 non-isa 관계 분류 시 사용했던 특징으로, 주어진 관계가 isa 관계 여부에 대한 판단에 도움이 될 것으로 기대하였다.
의미 관계 분류체계가 구축되면, 관계 분류에서 목표 카테고리를 상위 관계로 국한시킴으로써, 관계 유형의 수를 줄이고, 관계 분류의 정확도를 향상시킬 수 있을 것이다. 또 다른 해법으로 다중 관계 분류 문제플 이신 분류 문제로 변환하여, 출현 빈도수가 높은 관계 유형에 대해서만 관계 분류를 수행하는 것도 적은 적용률의 희생으로 높은 정확도를 얻는 방법이 될 것이다.
고영만, "시소러스 기반 온톨로지에 관한 연구", 성균관대학교, 정보관리 제5집, 2006
Gruber, T.R., "A Translation Approach to Portable Ontology Specifications," Knowledge Acquisition, 5 (2), 1993
"Inspec v2.0 Getting Started Guide," http://scientific.thomson.com/media/scpdf/inspec_gettingstarted_en.pdf
Soergel, D., B. Lauser, A. Liang, F. Fisseha, J. Keizer, S. Katz, "Reengineering Thesauri for New Applications: the AGROVOC Example," Journal of Digital Information, 4(4), Mar 2004
Kawtrakul, A., A. Imsombut, A. Thunkijjanukit, D. Soergel, A. Liang, M. Sini, G. Johannsen, J. Keizer, "Automatic Term Relationship Cleaning and Refinement for AGROVOC," Workshop on the 6th Agricultural Ontology Service, Jul 2005
Drummond, N., M. Horridge, R. Stevens, C. Wroe, S. Sampaio, "Pizza Ontology v1.5," http://www. co-ode.org/ontologies/pizza/, 2007
Navigli, R., P. Velardi, "Learning Domain Ontologies from Document Warehouses and Dedicated Web Sites," Computational Linguistics, 30 (2), 2004
"Summary Report on Taxonomic Databases Working Group(TDWG) Core Ontology Meeting," Edinburgh, UK, May 2006
Oberle, D., S. Lamparter, A. Eberhart, S. Staab, S. Grimm, P. Hitzler, S. Agarwal, R. Studer, "Semantic Management of Web Services using the Core Ontology of Services," W3C Workshop on Frameworks for Semantics in Web Services (Position Paper), 2005
Doerr, M., J. Hunter, C. Lagoze, "Towards a Core Ontology for Information Integration," In Journal of Digital information, 4(1), Apr 2003
KORTERM, http://korterm.or.kr/, IT분야 전문용어 사전
D. Sleeman, S. Potter, D. Robertson, and M. Schorlemmer, "Ontology Extraction for Distributed Environments," In Proceedings of Workshop on Knowledge Transformations for the Semantic Web (ECAI-02), Jul 2002
황금하, 이신목, 남윤영, 신지애, 최기선, "시소러스를 이용한 온톨로지 구축에서의 Isa 관계 설정", 한국정보과학회 제 33회 정기 총회 및 추계학술대회 논문집, 서울, 2006.10
Assem, M.V., V. Malaise, A. Miles, G. Schreiber, "A Method to Convert Thesauri to SKOS," In Proceedings in the 3rd European Semantic Web Conference, Jun 2006
Alani, H., "Ontology Construction from Online Ontologies," The 5th International Semantic Web Conference (Position paper), Nov. 2006
Golbeck, J., G. Fragoso, F. Hartel, J. Hendler, J. Oberthaler, B. Parsia, "The National Cancer Institute's Thesaurus and Ontology," Journal of Web Semantics, 1 (1), Dec 2003
Wielinga, B., Schreiber, G., Wielemaker, J., & Sandberg, J.A.C., "From thesaurus to ontology," International Conference on Knowledge Capture, Oct 2001
Kang, S.J., J.H. Lee, "Semi-Automatic Practical Ontology Construction by Using a Thesaurus," Computational Dictionaries, and Large Corpora, Workshop on Human Language Technology and Knowledge Management (ACL2001), Jul 2001
Mika, P., D. Oberle, A. Gangemi, M. Sabou, "Foundations for service ontologies: Aligning owl-s to dolce," The 13th International World Wide Web Conference. 2004
A. Gangemi, F. Fisseha, J. Keizer, J. Lehmann, A. Liang, I. Pettman, M. Sini, M. Taconet, "A Core Ontology of Fishery and its Use in the Fishery Ontology Service Project," EKAW04 Workshop on Core Ontologies in Ontology Engineering, Oct 2004
Gangemi, A., P. Mika, M. Sabou, D. Oberle. "An Ontology of Services and Service Descriptions," Technical report, Laboratory for Applied Ontology (ISTC-CNR), 2003
Breuker, J., R. Hoekstra. "Epistemology and ontology in core ontologies: FOLaw and LRI-Core,. two core ontologies for law," EKAW04 Workshop on Core Ontologies in Ontology Engineering, Oct 2004
C. Baker, M. Ellsworth, K. Erk, "SemEval'07 Task 19: Frame Semantic Structure Extraction," The 4th International Workshop on Semantic Evaluations (SemEval-2007), Jun 2007
R. Girju, P. Nakov, V. Nastase, S. Szpakowicz, P. Turney, D. Yuret, "SemEval-2007 Task 04: Classification of Semantic Relations between Nominal," In the Proceedings of the 4th International Workshop on Semantic Evaluations (SemEval- 2007), Jun 2007
Choi, K.S., H.S. Bae, "Procedures and Problems in Korean-Chinese-Japanese Wordnet with Shared Semantic Hierarchy," The Global WordNet Conference, Jan 2004
황금하, 이주호, 최기선, "소스-채널 모델을 이용한 한국어 전단어 의미태깅 시스템", 2004년도 한국인지과학회 춘계학술대회. 2004. 06
Zhang, L., "Maximum Entropy Toolkit for Python and C++," 2004
이 논문을 인용한 문헌
저자의 다른 논문 :
연구과제 타임라인
LOADING...
LOADING...
LOADING...
LOADING...
LOADING...
활용도 분석정보
상세보기
다운로드
내보내기
활용도 Top5 논문
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다. 더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.