$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

그래프 구조를 이용한 카테고리 구조로부터 상하위 관계 추출
Graph-based ISA/instanceOf Relation Extraction from Category Structure 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.37 no.6, 2010년, pp.464 - 469  

최동현 (KAIST 전산학과) ,  최기선 (KAIST 전산학과)

초록
AI-Helper 아이콘AI-Helper

상하위 관계 자동 추출은 분류체계를 자동 구축하는 데 있어서 핵심적인 내용이며, 이렇게 자동으로 구축된 분류 체계는 정보 추출과 같은 여러 가지 분야에 있어서 중요하게 사용된다. 본 논문에서는 카테고리 구조로부터 상하위 관계를 추출하는 방식에 대하여 제안한다. 본 논문에서는 판별하고자 하는 카테고리 구조뿐만이 아닌, 그와 관련된 다른 카테고리 구조까지 고려하여 카테고리 이름에 나타난 토큰들간의 수식 그래프를 구축한 후, 그래프 분석 알고리즘을 통하여 각 카테고리 구조가 상하위 관계일 가능성에 대한 점수를 매긴다. 실험 결과, 본 알고리즘은 기존의 연구로 상하위 관계임을 판별할 수 없었던 일부 카테고리 구조에 대하여 성공적으로 상하위 관계인지를 판별하였다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose a method to extract isa/instanceOf relation from category structure. Existing researches use lexical patterns to get isa/instanceOf relation from the category structure, e.g. head word matching, to determine whether the given category link is isa/instanceOf relation or not....

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서 임의의 카테고리 구조에 속하는 카테고리 링크를 <A, B, Q의 형태로써 표현하였을 뗴, A는 日를 포함하는 카테고리의 이름-, B는 A에 의해 포함되는 카테고리 또는 페이지의 이름, ne A와 B 사이에 존재하는 카테고리의 개수이다. 예를 들어, Wikipedia의 iPod 페이지는 “2001 iiitroduction', eportable media player", eindustrial design examples, , "/尸od"근}는 4 개의 카테고리에 속해 있는데, 이를 위의 표현 방식으로 나타내면, <2001 introduction, iPod, 0>, <Portable media players, iPod, 0>, industrial design examples, iPod, 0>, <IPod, iPod, 이 된다.
  • 본 논문에서는 그래프 분석을 통하여 위키피디아 카테고리 구조에서 상하위 관계를 얻어내는 새로운 방법에 대하여 서술하였다. 다른 알고리즘과의 비교 결과, 본 논문에서 제시된 방법은 기존에 제시된 방법[7, 8]을이용하여 알아낼 수 없었던 상하위 관계들을 얻어낼 수 있었다.
  • 본 시스템에서 카테고리 링크의 점수를 계산하는 데 사용된 자질들 각각의 영향을 살펴보기 위하여, 각 자질만을 이용하여 점수를 계산하는 실험을 수행하였다. 표 2는 이 실험의 결과를 보여준다:
  • 〔7〕의 논문에서 보고된 바에 의하면, [기의 방법으로는 349, 263개의 카테고리-카테고리 링크 중 81, 564개에 대하여, 그것이 상하위 관계언지를 판별할 수 없었고, 또한 카테고리 - 페이지 링크에 관해서는 연구가 진행되지 않았다. 본 연구에서는 기존연구의 이러한 한계를 극복하기 위하여, 카테고리 링크가 주어졌을 때 관련된 다른 카테고리 링크들을 이용하여 하위 카테고리/페이지의 본질 속성을 이루는 토큰들을 파악함으로써, 주어진 카테고리 링크에 포함된 두 카테고리/페이지 이름이 상하위 관계인지를 판별하는 방법을 제안한다.
  • 본 연구에서는 주어진 카테고리 구조로부터 상 하위관계를 추출하는 방식에 대하여 제안한다. 즉, 본 연구에서는 어떤 임의의 카테고리 구조에 속하는 카테고리링크 각각에 대하여, 해당 카테고리 링크가 상하위(ISA/ instanceOf) 관계를 의미하고 있는지, 또는 단순히 광의어(BT)/협의어(NT)/관련어(RT) 관계를 의미하고 있는지를 판별하는 알고리즘을 제안한다.
  • 추출하는 방식에 대하여 제안한다. 즉, 본 연구에서는 어떤 임의의 카테고리 구조에 속하는 카테고리링크 각각에 대하여, 해당 카테고리 링크가 상하위(ISA/ instanceOf) 관계를 의미하고 있는지, 또는 단순히 광의어(BT)/협의어(NT)/관련어(RT) 관계를 의미하고 있는지를 판별하는 알고리즘을 제안한다.

가설 설정

  • 가정 2에 따르면, 어떤 토큰 A가 본질 토큰이고, 토큰 B가 어떤 카테고리 이름 내에서 A와 같이 등장할 경우, 토큰 B 또한 본질 토큰일 가능성이 높다. 이는, 서로 같이 자주 등장하는 두 토큰은 의미적으로 연관이 있을 가능성이 높다는 가정의 연장이다.
  • 이는, 서로 같이 자주 등장하는 두 토큰은 의미적으로 연관이 있을 가능성이 높다는 가정의 연장이다.
본문요약 정보가 도움이 되었나요?

참고문헌 (14)

  1. A. Hotho, S. Staab, G. Stumme, "Ontologies improve text document clustering," Porceedings of the IEEE International Conference on Data Mining, pp.541-544, 2003. 

  2. S. Chakrabarti, B. Dom, R. Agrawal, P. Raghavan, "Using taxonomy, discriminants, and signatures for navigating in text databases," Proceedings of the international conference on very large data bases, 1997. 

  3. M. Sanderson, B. Croft, "Deriving concept hierarchies from text," Proceedings of the International Conference on New Methods in Language Processing, 1994. 

  4. P. Cimiano, A. Hotho, S. Staab, "Learning Concept Hierarchies from Text Corpora using Formal Concept Analysis," Journal of Artificial Intelligence Research, vol.24, pp.305-339, 2005. 

  5. P. Cimiano, A. Pivk, L. Schmidt-Thieme, S. Staab, "Learning Taxonomic Relations from Heterogeneous Sources of Evidence," Ontology Learning from Text: Methods, Evaluation and Applications, pp.59-73, 2005. 

  6. J. X. Huang, J. A. Shin, K. S. Choi, "Enriching Core Ontology with Domain Thesaurus through Concept and Relation Classification," OntoLex07. 2007. 

  7. S. P. Ponzetto, M. Strube, "Deriving a Large Scale Taxonomy from Wikipedia," Proceedings of the national conference on artificial intelligence, 2007. 

  8. V. Nastase, M. Strube, "Decoding Wikipedia category names for knowledge acquisition," Proceedings of the 23rd Conference on the Advancement of Artificial Intelligence, pp.1219-1224. 2008. 

  9. Wikipedia, http://www.wikipedia.org/ 

  10. DBpedia, http://dbpedia.org/About 

  11. M. Collins, "Head-driven statistical models for natural language parsing," Ph.D. thesis, University of Pennsylvania, Philadelphia, 1999. 

  12. J. M. Kleinberg, "Authoritative sources in a hyperlinked environment," Journal of the ACM, vol.46, no.5, pp.604-632, 1999. 

  13. R. Mihalcea, P. Tarau, "A Language Independent Algorithm for Single and Multiple Document Summarization," Proceedings of IJCNLP 2005, 2005. 

  14. R. Mizoguchi, "Part 3: Advanced cource of ontological engineering," New Generation Computing, vol.22, no.2, pp.193-220, 2004. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로