$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

개념 및 관계 분류를 통한 분야 온톨로지 구축
Building Domain Ontology through Concept and Relation Classification 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.35 no.9, 2008년, pp.562 - 571  

황금하 (한국과학기술원 전자전산학부) ,  신지애 (한국정보통신대학교 전산학과) ,  최기선 (한국과학기술원 전자전산학부)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 분야 온톨로지 구축을 위하여 분야 상위 온톨로지를 구축한 다음, 분야 시소러스의 개념과 관계를 이용하여 분야 상위 온톨로지를 확장하는 방법을 제안한다. 이를 위하여 우선 일반분야 시소러스와 분야 사전을 이용하여 분야 상위 개념 분류체계를 구축한다. 다음, 분야 시소러스의 개념을 분야 상위 온톨로지의 상위 개념으로 분류하고, 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT) 사이의 관계를 분야 상위 온톨로지에서 정의한 의미관계로 분류한다. 개념 분류는 두 단계로 진행되는데, 1단계에서는 빈도수 기반 방법, 2단계에서는 유사도 기반방법을 적용하여 시소러스 개념을 분야 상위 온톨로지의 개념으로 분류한다. 관계 분류에서는 두 가지 방법을 적용하였는데, (i) 훈련데이타가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 iso와 기타 관계(non-isa관계)로 분류하고, 다시 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ii) 훈련데이타를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 특징기반 분류 기법을 사용하되, k-Nearest Neighbors(k-NN)방법으로 훈련데이타를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과 사람에 의한 판단 결과와 비교 가능한 성능을 보여 주었다.

Abstract AI-Helper 아이콘AI-Helper

For the purpose of building domain ontology, this paper proposes a methodology for building core ontology first, and then enriching the core ontology with the concepts and relations in the domain thesaurus. First, the top-level concept taxonomy of the core ontology is built using domain dictionary a...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이런 정보는 온톨로지를 구성하는 가장 기본적인 정보이기어〕, 시소러스를 이용하여 온톨로지를 구축할 수 있다[3AL 시소러스와 온톨로지는 모두 개념과 관계 정보를 가지고 있지만, 시소러스의 관계는 주로 상하위 관계와 동의/유의 관계* 부분 전체 관계로 국한되어 있고, 기타관계를 가지고 있더라도 세분화하지 않고 BT-NT/KT 관계로만 표현한다[3, 5-7丄 예를 들면, 분야 시소러스인 bispe시}⑸의 계층체계에는 i&z 관계와 non ”관계가 혼재하여 있는데, 예를 들면 그림 1에서 "SCADA sys- 坨ms"와 r/Data acquisition^ 사이는 mm-切관계 임에도 불구하고 i皿 콴계 와 똑 같이 표현된다.간계로 구성된 엄격한 상하위 계층체계(taxonomic hierarchy)와 구별하기 위하여, 본 논문에서는 분야 시소러스의 이러한 계층체계를 BT-N17RT계층체계라고 부르기로 한다, 시소러스가 지식 표현 자체에 a 목적을 두고 있다면, 온톨로지는 자동추론을 최종 목적으로 하고 있기에, 엄격한 상하위 관계(怂Z 관계)와 세분화된 관계 정보로 개념의 속성을 나타낸다. 예를 들면 동물 온톨로지에서는 동물의 식성을 표현하기 위하여 "估라는 관계가 필요하고, 피자 온톨로지에서는 피자의 토핑과 산지 속성을 나타내기 위하여 h蓝 To】項 mg 과 has Country Of Origin 세분화된 관계를 사용한다[8L
  • 관계 분류 후 BT와 RT가 상위어 없이 최상위 개념으로 남는 것을 방지하기 위하여, 본 논문에서는 개념분류를 통하여 이들 용어를 분야 상위 온톨로지의 개념 (의미 키테고리)으로 분류한다. 이러한 개념 및 관계 분류를 .
  • 그러나 본 과제의 연구대상인 IT 분야와 Inspec 시소러스는 기존의 연구들보다 포괄적인 분야를 다루기 때문에, 패턴을 수동적으로 정의하기엔 어려움이 있다. 이 문제를 해결하기 위하여본 논문에서는 규칙과 패턴기반 관계 분류 외에 지도식 관계 분류 방법을 제안하였다. 본 과제가 이런 기존 연구와의 또 다른 차이점은, 본 논문에서는 관계 분류뿐만 아니라, 개념 분류도 수행하여, 분야 시소러스의 BT- NT/令T계층을 분야 온톨로지를 위한 상하위 계층으로 변환시키고 있다.

가설 설정

  • .Isa 특징: 규칙기반 방법으로 isa로 분류되는가? 개념 특징은 패턴기반 분류에서 사용한 특징을 반영한 것이고, 반면 isa 특징은 규칙기반 방법의 판단 결과를 직접 사용하는 것이다.
  • 분류한다. t 로 Inspec 용어를, ht 로 f의 중심어를 표시하고, ht m개의 CoreNet 개념에 대응된다고 가정한다. ⑰로 q의 IT분야 보편성 점수를 나타내면, IT분야에서 t의 개념 c느 식 (2)에 의하여 분류된다:
  • 로 IT 분야 용어를, 4 로 f 의 중심 어를 표시 하고, 而 가 가지고 있는 m개의 의미는 CoreNet 개념 化i, …<九… CnJ 에 각각 대응된다고 가정한다. 중심어 &가 개념로 개념분류(의미태깅)되는 확률을 PHgI 相로 표시하면, IT 분야에서 용어 f 의 상위 개념 G 는 식 (1)에 의하여 분류된다.
본문요약 정보가 도움이 되었나요?

참고문헌 (29)

  1. 최기선, 류법모, "온톨로지 구축과 학습: 상하위 관계", 정보과학회지, 24(4), 2006.4 

  2. 최호섭, 임지희, 배영준, 최수일, 옥철영, "온톨로지 구축 방법과 사례", 정보과학회지, 24(4), 2006.4 

  3. 고영만, "시소러스 기반 온톨로지에 관한 연구", 성균관대학교, 정보관리 제5집, 2006 

  4. Gruber, T.R., "A Translation Approach to Portable Ontology Specifications," Knowledge Acquisition, 5 (2), 1993 

  5. "Inspec v2.0 Getting Started Guide," http://scientific.thomson.com/media/scpdf/inspec_gettingstarted_en.pdf 

  6. Soergel, D., B. Lauser, A. Liang, F. Fisseha, J. Keizer, S. Katz, "Reengineering Thesauri for New Applications: the AGROVOC Example," Journal of Digital Information, 4(4), Mar 2004 

  7. Kawtrakul, A., A. Imsombut, A. Thunkijjanukit, D. Soergel, A. Liang, M. Sini, G. Johannsen, J. Keizer, "Automatic Term Relationship Cleaning and Refinement for AGROVOC," Workshop on the 6th Agricultural Ontology Service, Jul 2005 

  8. Drummond, N., M. Horridge, R. Stevens, C. Wroe, S. Sampaio, "Pizza Ontology v1.5," http://www. co-ode.org/ontologies/pizza/, 2007 

  9. Navigli, R., P. Velardi, "Learning Domain Ontologies from Document Warehouses and Dedicated Web Sites," Computational Linguistics, 30 (2), 2004 

  10. "Summary Report on Taxonomic Databases Working Group(TDWG) Core Ontology Meeting," Edinburgh, UK, May 2006 

  11. Oberle, D., S. Lamparter, A. Eberhart, S. Staab, S. Grimm, P. Hitzler, S. Agarwal, R. Studer, "Semantic Management of Web Services using the Core Ontology of Services," W3C Workshop on Frameworks for Semantics in Web Services (Position Paper), 2005 

  12. Doerr, M., J. Hunter, C. Lagoze, "Towards a Core Ontology for Information Integration," In Journal of Digital information, 4(1), Apr 2003 

  13. KORTERM, http://korterm.or.kr/, IT분야 전문용어 사전 

  14. D. Sleeman, S. Potter, D. Robertson, and M. Schorlemmer, "Ontology Extraction for Distributed Environments," In Proceedings of Workshop on Knowledge Transformations for the Semantic Web (ECAI-02), Jul 2002 

  15. 황금하, 이신목, 남윤영, 신지애, 최기선, "시소러스를 이용한 온톨로지 구축에서의 Isa 관계 설정", 한국정보과학회 제 33회 정기 총회 및 추계학술대회 논문집, 서울, 2006.10 

  16. Assem, M.V., V. Malaise, A. Miles, G. Schreiber, "A Method to Convert Thesauri to SKOS," In Proceedings in the 3rd European Semantic Web Conference, Jun 2006 

  17. Alani, H., "Ontology Construction from Online Ontologies," The 5th International Semantic Web Conference (Position paper), Nov. 2006 

  18. Golbeck, J., G. Fragoso, F. Hartel, J. Hendler, J. Oberthaler, B. Parsia, "The National Cancer Institute's Thesaurus and Ontology," Journal of Web Semantics, 1 (1), Dec 2003 

  19. Wielinga, B., Schreiber, G., Wielemaker, J., & Sandberg, J.A.C., "From thesaurus to ontology," International Conference on Knowledge Capture, Oct 2001 

  20. Kang, S.J., J.H. Lee, "Semi-Automatic Practical Ontology Construction by Using a Thesaurus," Computational Dictionaries, and Large Corpora, Workshop on Human Language Technology and Knowledge Management (ACL2001), Jul 2001 

  21. Mika, P., D. Oberle, A. Gangemi, M. Sabou, "Foundations for service ontologies: Aligning owl-s to dolce," The 13th International World Wide Web Conference. 2004 

  22. A. Gangemi, F. Fisseha, J. Keizer, J. Lehmann, A. Liang, I. Pettman, M. Sini, M. Taconet, "A Core Ontology of Fishery and its Use in the Fishery Ontology Service Project," EKAW04 Workshop on Core Ontologies in Ontology Engineering, Oct 2004 

  23. Gangemi, A., P. Mika, M. Sabou, D. Oberle. "An Ontology of Services and Service Descriptions," Technical report, Laboratory for Applied Ontology (ISTC-CNR), 2003 

  24. Breuker, J., R. Hoekstra. "Epistemology and ontology in core ontologies: FOLaw and LRI-Core,. two core ontologies for law," EKAW04 Workshop on Core Ontologies in Ontology Engineering, Oct 2004 

  25. C. Baker, M. Ellsworth, K. Erk, "SemEval'07 Task 19: Frame Semantic Structure Extraction," The 4th International Workshop on Semantic Evaluations (SemEval-2007), Jun 2007 

  26. R. Girju, P. Nakov, V. Nastase, S. Szpakowicz, P. Turney, D. Yuret, "SemEval-2007 Task 04: Classification of Semantic Relations between Nominal," In the Proceedings of the 4th International Workshop on Semantic Evaluations (SemEval- 2007), Jun 2007 

  27. Choi, K.S., H.S. Bae, "Procedures and Problems in Korean-Chinese-Japanese Wordnet with Shared Semantic Hierarchy," The Global WordNet Conference, Jan 2004 

  28. 황금하, 이주호, 최기선, "소스-채널 모델을 이용한 한국어 전단어 의미태깅 시스템", 2004년도 한국인지과학회 춘계학술대회. 2004. 06 

  29. Zhang, L., "Maximum Entropy Toolkit for Python and C++," 2004 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로