$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

의미관계 정보를 이용한 약품 온톨로지의 구축과 활용
Medicine Ontology Building based on Semantic Relation and Its Application 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.32 no.5, 2005년, pp.428 - 437  

임수연 (경북대학교 컴퓨터공학과) ,  박성배 (경북대학교 컴퓨터공학과) ,  이상조 (경북대학교 컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

온톨로지는 주어진 응용 도메인의 특성을 나타내는 관련 개념들의 집합과 정의, 그리고 그들간의 관계로 이루어진다. 본 논문에서는 온톨로지를 구축하고 갱신할 때의 시간과 비용을 줄이기 위하여 텍스트의 분석결과를 이용한 도메인 온톨로지의 반자동 구축방안을 제안한다. 이를 위하여 관련 문서들 내에 출현한 전문용어들의 처리방안을 제시하고, 추출한 개념들과 그들간의 관계를 온톨로지의 구축에 활용한다. 실험 도메인은 약품분야로 정하였으며, 구축한 온톨로지는 문서의 검색에 활용하였다. 온톨로지 내의 계층관계들이 문서검색에 효용이 있음을 보이기 위하여 일반적인 키워드기반 문서검색과 온톨로지 내의 관련 정보들을 연관피드백에 이용한 온톨로지기반 문서검색을 비교한 결과, 후자의 경우 정확률$4.97\%$, 재현율$0.78\%$ 향상됨을 알 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

An ontology consists of a set and definition of concepts that represents the characteristics of a given domain and relationship between the elements. To reduce time-consuming and cost in building ontology, this paper proposes a semiautomatic method to build a domain ontology using the results of tex...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 구축된 온톨로지는 다양한 분야에서 활용될 수 있는데, 본 논문에서는 문서 검색의 효과를 향상시키기 위한 방안으로 이를 제안하고자 한다. 특정 분야의 주요 문서 집합을 선정한 후 이들 문서들의 내용을 분석하여 개념들을 추출하고 이들을 링크로 연결한 것이 온톨로지이며, 개념 추출의 목적은 문서들을 가장 잘 대표할 수 있는 명사들을 추출하는 것이다.
  • 따라서 본 논문에서는 도메인을 약품분야로 정한 뒤, 텍스트 내에 출현하는 전문용어들의 출현패턴을 분석한 결과를 약품 온톨로지의 구축에 이용하고자 한다. 이를 위하여 전문용어들을 구성하고 있는 접미사나 특정 명사들의 의미정보에 기반한 규칙들을 설정하고, 전문용어들과 그들 간의 관계를 추출함으로써 온톨로지 내의 노드들을 확장해나간다.
  • 이러한 전문용어는 하나의 도메인을 이해하는데 필요한 요소이기 때문에 특정 도메인에 대한 기계번역이나 정보검색을 보다 효율적이고 정확히 수행하기 위해서 전문용어에 대한 언어자원은 중요하다. 본 논문에서는 전문용어들을 자동으로 추출하기 위하여 그들의 출현형태를 분석하였다. 전문용어의 형태결합 방식은 매우 다양하다.
  • 본 논문에서는 제안한 전문용어의 추출방법을 이용하여 구축한 약품 온톨로지를 대상으로 입력된 질의어에 해당하는 개념뿐 아니라 그의 온톨로지 내 하위 개념들까지 탐색하는 것을 목적으로 하는 검색을 진행한다. 온톨로지 내의 가중치 부여는 벡터모델을 기반으로 주어진 문서들 내에서 특정 단어가 얼마나 자주 사용되는가를 나타내는 출현빈도로부터 유도될 수 있다.
  • 따라서 정제된 온톨로지의 구축을 위해서는 학습을 위한 문서 집합을 선정하는 일이 매우 중요하다. 논문에서는 해당 도메인의 개념들과 그들 간의 의미 관계를 추출하는 텍스트 마이닝(text mining) 기술을이용하여 온톨로지를 구축하고, 외부에 존재하는 대용량의 사전을 이용하여 확장하고자 한다. 이를 위하여 한국어 문서 내에 복합명사의 형태로 출현하는 전문용어들의 패턴들을 분류하고 이들의 구조를 분석한다.
  • 어떤 주제에 관한 단어들을 계층적으로 분류해 놓은 온톨로지는 다양한 분야에서 활용될 수 있는데, 본 논문에서는 문서 검색의 성능을 향상시키기 위한 방안으로 제안한다. 검색엔진은 온톨로지에 정의된 개념들과 규칙들을 검색의 성능을 활용시키기 위한 추론(inference) 의 기반으로도 이용할 수 있다.
  • 즉, 구체적인 온톨로지의 구축은 약품과 관련된 도메인 내에서 행해지며, 병명이나 증상에 따른 약품명이나 관련 문서들을 검색하기 위한 약품 온톨로지를 구축하는 것을 목적으로 한다.
  • 이를 제안하고자 한다. 특정 분야의 주요 문서 집합을 선정한 후 이들 문서들의 내용을 분석하여 개념들을 추출하고 이들을 링크로 연결한 것이 온톨로지이며, 개념 추출의 목적은 문서들을 가장 잘 대표할 수 있는 명사들을 추출하는 것이다. 특히 가중치가 부여된 온톨로지를 이용한 검색 시스템이나 질의응답 시스템의 경우에는 가중치에 따라 선별된 소수의 정보들만을 보여줌으로써 사용자의 판단에 도움을 줄 수 있다.
본문요약 정보가 도움이 되었나요?

참고문헌 (17)

  1. Missikoff, M., Velardi, P. and Fabriani, P., 'Text Mining Techniques to Automatically Enrich a Domain Ontology,' Applied Intelligence, Vol. 18, pp. 322-340, 2003 

  2. Kang, S. J. and Lee, J. H., 'Semi-Automatic Practical Ontology Construction by Using a Thesaurus, Computational Dictionaries, and Large Corpora,' ACL 2001 Workshop on Human Language Technology and Knowledge Management, pp. 45-52, 2001 

  3. Lim, S. Y, Koo., S. O., Song, M. H. and Lee, S. J., 'Hub-word based on Ontology Construction for Document Retrieval,' Proceedings of IC-AI'03, pp. 549-552, 2003 

  4. 임수연, 송무희, 이상조, '전문용어의 처리에 의한 도메인 온톨로지의 구축', 정보과학회 논문지(B), 제 31권 3호, pp. 353-360, 2004 

  5. Mahesh, K., 'Ontology Development for Machine Translation: Ideology and Methodology,' Technical Report MCCS 96-292, Computer Research Laboratory, New Mexico State University, 1996 

  6. Dong, Z. and Dong, Q., HowNet.http//www.keenage.com/zhwang/e_zhi wang.html, 1999 

  7. Lenat, D. B., 'Cyc: A Large-Scale Investment in Knowledge Infrastructure,' Communications of the ACM, Vol. 38, No. 11, pp. 33-38, 1995 

  8. Miller, George A., Martin Chodorow, Shari Landes, Claudia Leacock, and Robert G. Thomas, WordNet: An on-line Lexical database, International Journal of Lexicography, 3(4), pp. 235-244, 1990 

  9. 강신재, '실용적인 온톨로지의 반자동 구축 및 어휘 의미 중의성 해소를 위한 응용', 포항공대 박사학위논문, 2002 

  10. Ock, C. Y. and Choe, H. S., 'The Fundamental Construction Princi- pIes of UOU Ontology,' 1st International Workshop of The Korean Thesaurus Association, 2003 

  11. 문유진, '한국어 명사를 위한 WordNet의 설계와 구현', 정보과학회 논문지, 제2권, 4호, , pp. 437-445, 1996 

  12. 박정오, 황도삼, '전문용어 추출시스템', 정보과학회 봄 학술발표 논문집, 제27권, 1호, pp. 381-383, 2000 

  13. 이경희, 이주호, 최명석, 김길창, '한국어 문서에서 개체명 인식에 관한 연구', 제12회 한글 및 한국어 정보처리 학술대회 학술발표논문집, pp. 292-299, 2000 

  14. Klavans, J. and Muresan, S., 'DEFINDER:Rule-Based Methods for the Extraction of Medical Terminology and their Associated Definitions from On-line Text,' In Proceedings of AMIA Symposium, pp. 201-202, 2000 

  15. 신효식, 김재호, 이해윤, 최기선, '텍스트로부터 용어정의문 자동 추출방법', 제14회 한글 및 한국어 정보처리 학술발표 논문집, pp. 292-299, 2002 

  16. 오종훈, 이경순, 최기선, '분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출', 정보과학회 논문지, 제 29권 4호, pp. 258-269, 2002 

  17. 황이규, 윤보현, 'HMM에 기반한 한국어 개체명 인식', 정보처리학회 논문지(B), 제10권, 2호, pp. 229-236, 2003 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로