$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

가변 크기 문맥과 거리가중치를 이용한 동형이의어 중의성 해소
Word sense disambiguation using dynamic sized context and distance weighting 원문보기

한국마린엔지니어링학회지 = Journal of the Korean Society of Marine Engineering, v.38 no.4, 2014년, pp.444 - 450  

이현아 (Department of Computer Software Engineering, Kumoh National Institute of Technology)

초록
AI-Helper 아이콘AI-Helper

의미 중의성 해소를 위한 대부분의 기존 연구에서는 문장의 특성에 상관없이 고정적인 크기의 문맥을 사용해 왔다. 본 논문에서는 중의성 해소에서 문장에 따라 가변적인 크기의 문맥을 사용하는 가변길이 윈도우와 단어간 거리를 사용한 의미분석 방법을 제안한다. 세종코퍼스의 형태의미분석 말뭉치로 학습하여 12단어 32,735문장에 대해 실험한 결과에서 제안된 방법이 용언에 대하여 92.2%의 평균 정확도를 보여 고정 크기의 문맥을 사용한 경우에 비해 향상된 결과를 보였다.

Abstract AI-Helper 아이콘AI-Helper

Most researches on word sense disambiguation have used static sized context regardless of sentence patterns. This paper proposes to use dynamic sized context considering sentence patterns and distance between words for word sense disambiguation. We evaluated our system 12 words in 32,735sentences wi...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 고정된 크기의 문맥에서 발생하는 지식부족문제와 잡음발생을 줄이고 의미 분별에 핵심적인 자질들을 추출하기 위해 가변길이 윈도우에 기반한 중의성 해소를 제안하였다. 가변길이 윈도우를 적용하였을 때의 성능을 평가하기 위해 동일한 중의성 해소 모델에서 윈도우 크기별 성능평가를 수행하였다.
  • “서울을 대표할 수 있는 다리를 만들어 보자”의 경우 ‘다리’의 가변 윈도우 문맥인 ‘만들다’는 올바른 문맥이지만, “여덟 개의 다리가 피아노를 치는 손가락처럼”에서 ‘치다’는 올바른 문맥이 아니다. 이 문제를 해결하기 위해서 본 논문에서는 동형이의어와 가까울수록 높은 가중치를 부여하여 중의성 해소의 정확도를 향상시킨다. dist(w,h)가 단어 w와 동형이의어 h간 거리일 때, 식 (2) CO(w,hi) 대신 1/log(dist(w,h))를 사용하여 거리가중치가 반영된 값을 구한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
어휘 중의성 해소는 무엇인가? 자연언어처리에서 어휘 중의성 해소(word sense disambiguation)는 주어진 문장에서 단어의 올바른 의미를 파악하는 과정으로, 검색, 번역, 분류 등 관련 시스템의 성능 향상에 영향을 미치는 중요한 문제이다. 대부분의 중의성 해소 연구는 다의어(polysemy) 가 아닌 동형이의어(homograph)를 대상으로 하고 있다.
중의성 해소 연구의 대상은 무엇인가? 자연언어처리에서 어휘 중의성 해소(word sense disambiguation)는 주어진 문장에서 단어의 올바른 의미를 파악하는 과정으로, 검색, 번역, 분류 등 관련 시스템의 성능 향상에 영향을 미치는 중요한 문제이다. 대부분의 중의성 해소 연구는 다의어(polysemy) 가 아닌 동형이의어(homograph)를 대상으로 하고 있다. 현대 표준 한국어에서 동형이의어가 차지하는 비율은 약 30%로 상당한 부분을 차지한다[1].
동형이의어의 중의성 해소 방법에 대하여 설명하라 같은 품사를 가지는 동형이의어의 중의성 해소 방법은 언어자원에 기반한 방식과 지도학습, 비지도학습, 준지도학습 방식 등의 통계기반 방식, 두가지를 결합한 방식으로 나뉜다. 사전이나 시소러스(thesaurus)와 같은 언어자원에 기반한 방식은 사전의 뜻풀이나 워드넷(WordNet)과 같은 언어자원으로부터 의미정보를 수집하여 중의성을 해소 하는 방법으로, 말뭉치로부터 얻기 어려운 저빈도 어의 정보를 얻기 용이하지만 변화하는 언어특성을 반영하기 어렵다. 말뭉치에 기반한 통계기반의미분별에서는 의미태그가 부착된 말뭉치를 사용하는 지도학습이 비지도학습에 비해 우수한 성능을 보인다. 우리말의 경우 세종말뭉치의 의미태그 말뭉치 구축 이후 지도학습 기반 의미분별 연구가 활발하게 이루어지고 있다. 준지도학습은 정확도라는 지도학습의 장점과 자료 획득이 용이한 비지도학습의 장점을 결합한 모델로써 국외 중의성 해소 연구에 많이 사용되고 있다[3].
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. B. m. Kang, "Aspects of the use of homonyms"", Language research, vol. 41 no. 1, pp. 1-29, 2005 (in Korean). 

  2. J. M. Cho, Verb Sense Disambiguation Using Corpus and Dictionary, Ph.D Thesis, KAIST, 1998 (in Korean). 

  3. 21st Century Sejong Project, http://www.sejong.or.kr/, Accessed May 26, 2014. 

  4. J. Hur and C. Y. Ock, "A homonym disambiguation system based on semantic information extracted from dictionary definitions", Journal of KIISE: Software and Applications, vol. 28, no. 9, 2001 (in Korean). 

  5. J. S. Kim, C. H. Kim, W. W. Lee, S. D. Lee, and C. Y. Ock, "A homonym disambiguation system based on statistical model using sense category and distance weights", 13th Annual Conference of Human and Cognitive Language Technology, pp. 487-493, 2001 (in Korean). 

  6. J. S. Kim, H. S. Choe, and C. Y. Ock, "A korean homonym disambiguation model based on statistics using weights", Journal of KIISE: Software and Applications, vol. 30, no. 11, pp. 1112-1123, 2003 (in Korean). 

  7. S. J. Kang, "Ontology construction and its application to disambiguate word senses", The KIPS Transactions, vol. 11-B, no. 4, pp. 491-500, 2004 (in Korean). 

  8. J. S. Kim and C. Y. Ock, "A korean homonym disambiguation system using refined semantic information and thesaurus", The KIPS Transactions, vol. 12, no. 7, pp. 829-840, 2005 (in Korean). 

  9. M. H. Kim and H. C. Kwon, "Word sense disambiguation using semantic relations in Korean wordnet", Journal of KIISE: Software and Applications, vol. 38 no. 10, 2011, 554-564 (in Korean). 

  10. Y. S. Par, J. C. Shin, C. Y. Ock, and H. R. Park, "Verb sense disambiguation using subordinating case information", The KIPS Transactions, vol. 18-B, no. 4, pp. 241-248, 2011 (in Korean). 

  11. Y. G. Lee, "A study on statistical feature selection with supervised learning for word sense disambiguation", Journal of the Korean Biblia Society for Library and Information Science, vol. 25, no. 2, pp. 5-25, 2011 (in Korean). 

  12. A. C. Le, A. Shimazu, V. N. Huynh, and L. M. Nguyen, "Semi-supervised learning integrated with classifier combination for word sense disambiguation", Science Direct Computer Speech and Language, vol. 22, no. 4, pp. 330-345, 2008. 

  13. D. F. Amoros, and R. Heradio, "Understanding the role of conceptual relations in Word Sense Disambiguation", Expert Systems with Application, vol. 38, no. 8, pp. 9506-9516, 2011. 

  14. G. T. Park, T. H. Lee, S. H. Hwang, B. M. Kim, H. A. Lee, and Y. S. Shin, "Korean learning assistant system with automatically extracted knowledge", The Korea Information Processing Society Transactions on Software and Data Engineering, vol. 1, no. 2, pp. 91-102, 2012 (in Korean). 

  15. G. T. Park, T. H. Lee, S. H. Hwang, and H. A. Lee, "Statistical word sense disambiguation based on using variant window size", The 24th Annual Conference of Human and Cognitive Language Technology, pp. 40-46, 2012 (in Korean). 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로