$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

정보검색 성능 향상을 위한 단어 중의성 해소 모형에 관한 연구
Improving the Retrieval Effectiveness by Incorporating Word Sense Disambiguation Process 원문보기

정보관리학회지 = Journal of the Korean society for information management, v.22 no.2 = no.56, 2005년, pp.125 - 145  

정영미 (연세대학교 문헌정보학과) ,  이용구 (연세대학교)

초록
AI-Helper 아이콘AI-Helper

이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 $92\%$정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 $67\%$ 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 $39.6\%$의 정확률을 보였고, EM 알고리즘 통합 검색이 약 $36\%$의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 $37\%$와 비교하면 나이브 베이즈 통합 검색은 약 $7.4\%$의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 $3\%$의 성능 저하율을 보였다.

Abstract AI-Helper 아이콘AI-Helper

This paper presents a semantic vector space retrieval model incorporating a word sense disambiguation algorithm in an attempt to improve retrieval effectiveness. Nine Korean homonyms are selected for the sense disambiguation and retrieval experiments. The total of approximately 120,000 news articles...

주제어

참고문헌 (22)

  1. 허정, 옥철영. 2001. 사전의 뜻풀이말에서 추출한 의미정보에 기반한 동형이의어 중의성 해결 시스템. '정보과학회논문지: 소프트웨어 및 응용', 28(9): 688-698 

  2. Chung, Y. M., and Lee, J. Y. 2001. 'A Corpus-based Approach to Comparative Evaluation of Statistical Term Association Measures.' Journal of the American Society for Information Science and Technology, 52(4): 283-296 

  3. Gale, W. A. 1992. 'A Method for Disambiguating Word Sense in a Large Corpus.' Computers and the Humanities, 26: 415-439 

  4. Gale, W., Church, K. W., and Yarowsky, D. 1992a. 'Estimating Upper and Lower Bounds on the Performance of Word Sense Disambiguation Programs.' Proceedings of the 30th Annual Meeting of the Association for Computational Linguistics, 249-256 

  5. Gale, W., Church, K. W., and Yarowsky, D. 1992b. 'One sense per discourse.' Proceedings of the Speech and Natural Language Workshop, 233-237 

  6. Gale, W., Church, K. W., and Yarowsky, D. 1993. 'A method for disambiguating word senses in a large corpus.' Computers and the Humanities, 415-439 

  7. Ide, N., and Veronis, J. 1998. 'Word sense disambiguation: the state of the art.' Computational Linguistics, 24(1): 1-40 

  8. Jackson. P., and Moulinier, I. 2002. Natural Language Processing for Online Applications : Text Retrieval. Extraction. and Categorization. Amsterdam: John Benjamins Publishing Company 

  9. Jansen, B. J., and Spink, A. 2005. 'An analysis of web searching by European AlltheWeb.com users.' Information Processing and Management, 41 : 361-381 

  10. Jansen, B. J., Spink A., and Saracevic, T. 2000. 'Real life, real users, and real needs: a study and analysis of user queries on the web.' Information Processing and Management, 36: 207-227 

  11. Krovets, R., and Croft. W. B. 1992. 'Lexical ambiguity and information retrieval.' ACM Transactions on Information Retrieval Systems, 10(2): 115-141 

  12. Levinson, D. 1999. 'Corpus-based method for unsupervised word sense disambiguation.' Proceedings of the Workshop on Machine Learning in Human Language Technology. Advanced Course on Artificial Intelligence (ACAI 99), Chania, Greece, 267-273 

  13. Manning, C. D., and Schutze, H. 1999. Foundations of Statistical Natural Language Processing. Cambridge: MIT Press 

  14. Sanderson, M. 1994. 'Word sense disambiguation and information retrieval' Proceedings of the 17th international ACM SIGIR, 49-57 

  15. Sanderson, M. 2000. 'Retrieving with good. sense." Information Retrieval, 2(1): 49-69 

  16. Schutze, H. 1998. 'Automatic word sense discrimination.' Computational Linguistion Archive, 24(1) : 97-123 

  17. Schutze, H., and Pederson. J. 1995. 'Information retrieval based on word sense.' Proceedings of the Fourth Annual Symposium on Document Analysis and Information Retrieval. 161-175 

  18. Stevenson, M. 2003. Word Sense Disambiguation: the case for Combination for Knowledge Sources. California: CSLI Publications 

  19. Stokoe, C., Oakes, M. J., and Tait, J. 2003. 'Word sense disambiguation in information retrieval revisited.' Proceedings of the 26th ACM SIGIR, 159-166 

  20. TREC-7. 1999. Proceedings of the Seventh Text Retrieval Conference. Appendix A. Evaluation Techniques and Results. NIST Publication 500-242 

  21. Voorhees, E. M. 1993. 'Using WordNet to disambiguate word senses for text retrieval.' Proceedings of SIGIR '93, 171-180 

  22. Yarowsky, D. 1995. 'Unsupervised word sense disambiguation rivaling supervised methods.' Annual Meeting of the ACL Archive Proceedings of the 33rd conference on Association for Computational Linguistics, 189-196 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로