$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

어휘의미망(U-WIN)을 이용한 동형이의어 접미사의 의미 중의성 해소
Disambiguation of Homograph Suffixes using Lexical Semantic Network(U-WIN) 원문보기

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.1 no.1, 2012년, pp.31 - 42  

배영준 (울산대학교 정보통신공학과) ,  옥철영 (울산대학교 컴퓨터정보통신공학부)

초록
AI-Helper 아이콘AI-Helper

현재까지 대부분의 한국어처리시스템에서는 가급적 많은 접미파생명사를 사전에 등재하여 처리하였다. 그러나 접미사는 생산성이 높기 때문에 모든 접미파생명사를 사전에 등재하는 것은 한계가 있다. 따라서 접미파생명사의 의미 분석을 통해서 미등재 접미파생명사를 분석할 필요가 있다. 본 논문에서는 접미파생명사의 의미 분석의 일환으로 한국어 어휘의미망(U-WIN)을 이용한 동형이의어 접미사의 중의성 해소 방법을 제시한다. 형태 의미 주석 세종 말뭉치에서 동형이의어 접미사를 포함한 33,104개의 접미파생명사를 대상으로 실험하였다. 실험을 위해 먼저 동형이의어 접미사를 의미 태깅하였으며, 접미사 앞의 어근을 추출하여 U-WIN의 노드에 매핑시켰다. 또한 동형이의어 접미사와 결합되는 U-WIN 상의 노드들에 대해 거리 가중치를 부여하여 이를 동형이의어 접미사 중의성 해소에 사용하였다. 동형이의어 접미사 49종 중 세종말뭉치에 나타난 35개의 동형이의어 접미사를 대상으로 실험한 결과 91.01%의 정확률을 보였다.

Abstract AI-Helper 아이콘AI-Helper

In order to process the suffix derived nouns of Korean, most of Korean processing systems have been registering the suffix derived nouns in dictionary. However, this approach is limited because the suffix is very high productive. Therefore, it is necessary to analyze semantically the unregistered su...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 예를 들어 ‘제(劑)’는 병명이나 약품 등과만 결합한다. 따라서 본 논문에서는 의미태깅된 1,100만 어절의 세종말뭉치에서 접미파생명사를 의미 태깅하고, 의미 결합 제약을 어휘 의미망(U-WIN)에 기반한 모델을 개발하여 접미파생명사 분석을 통한 접미사 중의성 해소를 하고자 한다.
  • 본 논문에서는 말뭉치에서 접미사 앞에 나타나는 어근만을 대상으로 의미 중의성 해소를 시도한다. 그러나 어근이 U-WIN 내에 없는 경우 접미사의 의미 중의성을 해소할 수 없다.
  • 본 논문에서는 어휘의미망에 49종의 동형이의어 접미사와 결합할 수 있는 의미제약 속성값을 부여하여 동형이의어 접미사를 분별하고자 한다. 예를 들어, {추첨, 추모, 미국, 위염} 등은 U-WIN에서 다음 Fig.
  • 조민희(2006)은 U-WIN의 동의어, 유의어, 관련어, 하위어, 상위어 관계 정보를 활용하여 검색어 자동 추천, 관련 단어 제시, 질의어 확장 등을 서비스에 반영하는 사용자 중심의 검색 서비스 요소를 제안하였다. 이러한 어휘지능망의 의미 관계 정보를 활용한 서비스 요소를 통해 현재의 과학기술정보서비스의 검색 만족도를 향상시키는 동시에 사용자가 요구하는 정보를 빠르고 정확하게 검색할 수 있는 서비스 환경으로 개선시키고자 하였다[16].
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
어휘 의미 중의성 해소에 관한 연구는 사용하는 데이터의 형태에 따라 어떻게 분류할 수 있는가? 의미 처리 연구는 어휘, 구문, 문장의 의미를 분석하기 위해 이루어 졌으며, 어휘 의미 중의성 해소(Word Sense Disambiguation)에 관한 연구가 많이 진행되어 왔다. 이들은 사용하는 데이터의 형태에 따라서 지식베이스(사전, 의미망, 시소러스, 온톨로지 등)를 이용하는 방법과 말뭉치를 이용하는 방법으로 분류할 수 있고, 방법론에 따라서는 크게 규칙을 이용한 방법, 확률 통계를 이용한 방법 등으로 분류할 수 있다. 지식베이스를 이용한 방법은 기계 가독형 사전(Machine Readable Dictionary)과 어휘의미망과 같은 자원들을 사용하는데, 주로 사전의 뜻풀이나 예문, 개념들의 관계 등을 이용한다[4,5,6,7,8].
접사파생명사는 무엇인가? 접사파생명사는 독립적인 용법을 지닌 하나의 말(語根 또는 語基)에 접사(접두사, 접미사)가 결합된 단어로, 둘 이상의 형태소로 구성되는 점은 합성어와 같으나 접두사나 접미사가 어근(語根)에 종속적으로 결합되는 점이 합성어와 다르다. 접사는 그 자체로는 자립성을 가지지 못하지만 어근에 붙어 새로운 단어를 만들며, 접사에 따라서는 새로운 단어를 만들어내는 생산성 높은 것과 생상성이 낮은 것이 있다.
U-WIN에는 현재 몇 개의 어휘가 구축되어있는가? 울산대의 한국어 사용자 어휘지능망 (UserWord Intelligent Network, 이하 U-WIN)은 한국어의 공통적이고 개별적인 속성을 바탕으로 한국인의 보편적인 인지 체계와 개념관계를 파악하여 이를 어휘의 의미적·개념적 네트워크로 형성한 온톨로지적 어휘망이라 할 수 있다. U-WIN은 표준국어대사전을 기반으로 현재 48만 여 어휘가 구축된 상태이다. U-WIN은 전문용어 사전 및 백과사전의 어휘들도 포함하기 때문에 필요시 각 전문 분야별 용어들의 분포도 및 어휘망 형태를 확인할 수 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (19)

  1. J. Heo, H. C. Seo and M. G. Jang, "Homonym Disambiguation based on Mutual Information and Sense-Tagged Compound Noun Dictionary", Journal of KIISE, Vol.33, No.12. pp.1073-1089, 2006. 

  2. M. H. Kim and H. C. Kwon, "Word Sense Disambiguation using Semantic Relations", Journal of KIISE, Vol.38, No.10, pp.554-564, 2011. 

  3. S. J. Kang, "Ontology Construction and Its Application to Disambiguate Word Senses", The KIPS transactions: Part B, Vol.11, No.4, pp.491-500, 2004. 

  4. M. Lesk , "Automatic sense disambiguation using machine readable dictionaries: How to tell a pine cone from an ice cream cone", In Proceedings of the 5th SIGDOC (New York, NY), pp.24-26, 1986. 

  5. S. Banerjee and T. Pedersen, "Extended gloss overlaps as a measure of semantic relatedness", In Proceedings of the 18th International Joint Conference on Artificial Intelligence (IJCAI, Acapulco, Mexico), pp.805-810, 2003. 

  6. P. Resnik, "Selectional preference and sense disambiguation", In Proceedings of the ACL SIGLEX Workshop on Tagging Text with Lexical Semantics: Why, What, and How? (Washington, D.C.), pp.52-57, 1997. 

  7. D. Yarowsky , "Word-Sense Disambiguation using Statistical Models of Roget's Categories Trained on Large Corpora", In Proceedings of Coling-92, 1992. 

  8. R. Navigli and P. Velardi, "Structural semantic interconnections: A knowledge-based approach to word sense disambiguation", IEEE Trans. Patt. Anal. Mach. Intell. Vol.27, No.7, pp.1075-1088, 2005. 

  9. R. Navigli, "Word sense disambiguation: A survey", ACM Computing Surveys, Vol.41, Issue 2, No.10, 2009. 

  10. M. Galley and K. Mckeown, "Improving word sense disambiguation in lexical chaining", In Proceedings of the 18th International Joint Conference on Artificial Intelligence (IJCAI, Acapulco, Mexico). pp.1486-1488, 2003. 

  11. R. Mihalcea, P. Tarau and E. Figa, "Pagerank on semantic networks, with application to word sense disambiguation", In Proceedings of the 20th International Conference on Computational Linguistics (COLING, Geneva, Switzerland), pp.1126-1132, 2004. 

  12. A. S. Yoon, S. H. Hwang, E. R. Lee and H. C. Kwon, "Construction of Korean Wordnet KorLex 1.5 ", Journal of KIISE: Software and Applications, Vol.36, No.1, pp.92-108, 2009. 

  13. S. H. Lee, "세종 전자 사전의 어휘 의미 부류 체계", 새국어생활 Vol.17, No.3, pp.51-67, 2007. 

  14. J. H. Im, Y. J. Bae, H. S. Choe and C. Y. Ock, "A Measure of Semantic Similarity and its Application in User-Word Intelligent Network", in Proceedings of the KCC, Vol.34, No.1, pp.189-193, 2007. 

  15. J. H. Im, H. S. Choe and C. Y. Ock, "Semantic Information Retrieval Based on User-Word Intelligent Network", in Proceedings of KCA, Vol.4, No.2, pp.547-550, 2006. 

  16. M. H. Cho, S. F. Choi, H. S. Choi and H. M. Yoon, "Improvement of Science and Technology Information Retrieval Service using Semantic Language Resource", in Proceedings of KCA, Vol.4, No.2, pp.570-574, 2006. 

  17. Y. H. Lee, C. Y. Ock and E. B. Lee, "Korean Compound Noun Decomposition and Semantic Tagging System using User-Word Intelligent Network", The KIPS transactions: Part B, Vol.19, No.1, pp.63-76, 2012. 

  18. Y. J. Nam and C. Y. Ock, "Constructing Dictionary Information for the Processing of Derivational Suffixes of Nouns based on corpus Analysis", Journal of KIISE, Vol.23, No.4, pp.389-401, 1996. 

  19. R. J. Kim and Y. J. Jeong, "A Device for Distinguishing Homonym Relationship of Suffix '-i'", Journal of Korealex, Vol.12, pp.185-207, 2008. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로