최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.12 no.6, 2012년, pp.41 - 47
박용민 (충북대학교 디지털정보융합학과) , 이재성 (충북대학교 디지털정보융합학과)
Various Korean word sense disambiguation methods have been proposed using small scale of sense-tagged corpra and dictionary definitions to calculate entropy information, conditional probability, mutual information and etc. for each method. This paper proposes a method using Korean Word Space model w...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
한국어 단어의 의미 중의성 해소 방법엔 무엇이 있는가? | 한국어 단어의 의미 중의성 해소 방법들은 주로 소규모의 의미 태그 부착 말뭉치나 사전 정보 등을 이용하여 엔트로피 정보, 조건부 확률, 상호정보 등을 각각 계산하고 이를 중의성 해소에 이용하는 방법 등으로 다양하게 제안되었다. 본 논문에서는 대규모로 구축된 의미 태그 부착 말뭉치를 이용하여 한국어 단어 벡터를 추출하고 이 벡터들 사이의 유사도를 계산하여 단어 의미 중의성을 해소하는 단어 공간 모델 방법을 제안한다. | |
중의성이 있는 자연언어의 예시엔 무엇이 있는가? | 그러나 자연언어의 단어는 중의성이 있을 수 있으며, 이에 대한 잘못된 해석은 텍스트 의미 처리의 신뢰도를 떨어뜨릴 수 있다. 예를 들어 '배다'의 경우, '배'는 명사나 동사 등으로 해석될 수 있으며, 명사일 경우는 먹는 배, 타는 배, 신체의 일부인 배 등으로 또 다시 구분되고, 동사일 경우는 '새끼를 배다'와 같이 수태한 경우를 나타내는 뜻으로 구분된다. 만약 ‘먹는 배’를 검색할 경우, 단어 중의성을 고려하지 않고 결과를 출력한다면 여러 다른 뜻의 ‘배’가 포함되어 그 정확도를 떨어뜨릴 것이다. | |
단어의 중의성은 어떻게 나눌 수 있는가? | 단어의 중의성은 크게 문법적 중의성과 의미적 중의성으로 나눌 수 있다. 앞에서와 같이 ‘배다’의 경우, 동사에는 하나의 의미만 있다면 품사 구분만으로도 그 의미를 결정할 수 있으나, 명사의 경우 문맥을 파악하여 가능한 여러 의미중 하나를 선택해야 한다. |
이호, 백대호, 임해창, "분류 정보를 이용한 단어 의미 중의성 해결", 정보과학회논문지(B), 제24권, 제7호, pp.779-789, 1997.
허정, 옥철영, "사전의 뜻풀이말에서 추출한 의미 정보에 기반한 동형이의어 중의성 해결 시스템", 정보과학회논문지 소프트웨어 및 응용, 제28권, 제9호, pp.688-698, 2001.
H. Schutze, "Automatic Word Sense Discrimination," Computational Linguistics, Vol.24, No.1, 1998.
Manning, D. Christopher and Schutze, Hinrich, Foundations of Statistical Natural Language Processing, MIT Press, pp.229-261, 1999.
W. A. Gale, W. C. Kenneth, and D. Yarowsky, "A method for disambiguating word senses in a large corpus," Computers and the Humanities, Vol.26, pp.415-439, 1992.
P. F. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and R. L. Mercer, "Word-sense disambiguation using statistical methods," In Proceedings, 29th Annual Meeting of the Association for Computational Linguistics, pp.264-270, 1991.
M. Lesk, "Automatic sense disambiguation: How to tell a pine cone from an ice cream cone," In Proceedings of the 1986 SIGDOC Conference, pp.24-26, 1986.
D. E. Walker, "Knowledge resource tools for accessing large text files," In Sergei Nirenburg(ed.) Machine Translation: Theoretical and methodological issues, Cambridge: Cambridge University Press, pp.247-261, 1987.
Dagan Ido, and Alon Itai., "Word sense disambiguation using a second language monolingual corpus," Computational Linguistics, Vol.20, pp.563-596, 1994.
Dagan Ido, Alon Itai, and Ulrike Schwall, "Two languages are more informative than one," In Proceedings, 29th Annual Meeting of the Association for Computational Linguistics, pp.130-137, 1991.
국립국어원, 21세기 세종계획 최종 성과물(2011년 12월 수정판), 2011.
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.