$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

대규모 말뭉치와 전산 언어 사전을 이용한 의미역 결정 규칙의 구축
Rule Construction for Determination of Thematic Roles by Using Large Corpora and Computational Dictionaries 원문보기

정보처리학회논문지. The KIPS transactions. Part B. Part B, v.10B no.2, 2003년, pp.219 - 228  

강신재 (대구대학교 정보통신공학부) ,  박정혜

초록
AI-Helper 아이콘AI-Helper

본 논문은 한국어정보처리 과정에서 구문 관계를 의미역으로 사상시키기 위한 규칙을 효과적으로 구축하는 방법을 제시하고 있다. 의미역의 결정은 의미 분석의 핵심 작업 중 하나이며 자연어처리에서 해결해야 하는 매우 중요한 문제 중 하나이다. 일반적인 언어학 지식과 경험만 가지고 의미역 결정 규칙을 기술하는 것은 작업자의 주관에 따라 결과가 많이 달라질 수 있으며, 또 모든 경우를 다룰 수 있는 규칙의 구축은 불가능하다. 하지만 본 논문에서 제시하는 방법은 대량의 원시 말뭉치를 분석하여 실제 언어의 다양한 사용례를 반영하며, 또 수십 명의 한국어 학자들이 심도 있게 구축하고 있는 세종전자사전의 격틀 정보도 함께 고려하기 때문에 보다 객관적이고 효율적인 방법이라 할 수 있다. 의미역을 보다 정확하게 결정하기 위해 구문관계, 의미부류, 형태소 정보, 이중주어의 위치정보 등의 자질 정보를 사용하였으며, 특히 의미부류의 사용으로 인해 규칙의 적용률이 향상되는 효과를 가져올 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

This paper presents an efficient construction method of determination rules of thematic roles from syntactic relations in Korean language processing. This process is one of the main core of semantic analysis and an important issue to be solved in natural language processing. It is problematic to des...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 결정은 격틀(case frame)과 같은 언 어 지식 (linguistic knowledge)을 필요로 하지만, 지식 구죽의 어려움 때문에 그다지 연구가 활발하지는 못한 실정이다. 그 래서 본 연구에서는 사용 가능한 격틀 정보가 없거나 부족한 경우에, 단어 의미(word sense)가 태깅된 구문 트리(syrtac- tic tree)를 입력으로 받아, 주어/목적어와 같은 구문관계를 행위주/대상과 같은 의미역으로 사상하여 의미 (seman­ tic tree)를 생성하는 시스템을 구축하고자 한다(그림 1)1).
  • 데, 이를 언어학 논저에서 제시하고 있는 일반 적 원칙과 말뭉치 분석 결과, 그리고 세종전자사전의 정보 등을 종합하여 구문관계에 따른 의미역을 정리해 본 것이 이다.
  • 본 논문에서는 의미 분석의 한 부분인 의미역 결정을 위한 규칙올 대규모 말뭉치와 기계번역 시스템, 세종 전자사 전올 활용하여 구축하는 방법을 제시하였다. 사실 격틀과 같은 언어 지식이 의미역 결정에서 대단히 중요한 역할을 하지만, 이것이 가용치 않은 경우가 대부분이므로 기존 언 어 자원올 최대한 활용하여, 규칙의 구축이 보다 객관적이 고 효율적으로 이루어지게 하였다.
  • 일반적으로 언어를 분석할 때는 형 태소 분석과 구문 분석의 과정을 거쳐 의미 분석을 하게 되 는데, 의미 분석에서는 단어의 의미 중의성 해소(word sense disambiguation)4 단어간 의미역(thematic role)의 결정이 주요한 작업이다. 이러한 여러 과정 가운데 본 논문에서는 의미 분석에서의 의미역 결정에 대해 논하고자 한다.
  • 의미역은 논항들이 문장 내에서 수행하 고 있는 역할[8]을 의미하므로 필수 논항인 구성요소에만 할당하는 것이 원칙이다. 하지만 남기심[3]에서 밝히고 있 듯이 논항과 부가항의 구분이 어렵고, 또 궁극적인 의미분 석을 위해서는 부가항에 대해서도 의미역을 결정해야 하므 로 본 연구에서는 논항 뿐만 아니라 부가항에 대해서도 의 미역을 결정하는 것을 목표로 한다.

가설 설정

  • 철수는 영희의 합격에 무척 기뻐했다.
  • 구문관계에서 의미관계로 사상할 때 어떠한 경우에 트리 가 변형되는지에 관해, 현재까지의 연구 결과로는 완전히 정리가 되지 않기 때문에, 본 논문에서는 구문 트리가 변형 되지 않는다는 가정 하에서 연구를 진행하였다. 의미역 사 상 후의 의미 트리를 표현하기 위해서는 개념 그래프(con­ ceptual graph)[10, 15]를 사용하고 있는데, 이는 개념 노드 (conceptual node)와 그 개념을 연결해 주는 개념 관계 노 H(conceptual relation node)로 개념 그래프가 이루어진다 는 점에서 본 연구의 결과와 매우 유사한 특성을 가지고 있기 때문이다.
본문요약 정보가 도움이 되었나요?

참고문헌 (20)

  1. 21세기 세종계획 전자사전 개발 연구보고서, 문화관광부, 2000 

  2. 김나리, 김영택, '한국어 동사 패턴에 기반한 한국어 문장 분석과 한영 변환의 모호성 해결,' 한국정보과학회논문지, 제23권 제7호, pp.766-775, 1996 

  3. 남기심, '국어 조사의 용법 '-에' 와 '-로'를 중심으로', 서광학술자료사, 1993 

  4. 박성배, 김영택, '한영 기계번역에서 결정 트리 학습에 의한 한국어 부사격 조사의 의미 중의성 해소', 한국정보과학회논문지, 제27권 제6호, pp.668-677, 2000 

  5. 박정운, '한국어 도구격 조사의 다의어 체계 언어', 제24권 제3호, pp.405-426, 1999 

  6. 서정수, '국어 문법', 뿌리 깊은 나무, 1994 

  7. 양단희, 송만석, '기계학습에 의한 단어의 격 원형성 자동 획득', 한국정보과학회논문지, 제25권 제7호, pp.1116-1127, 1998 

  8. 이익환, '의미론 개론', 한신문화사, 1995 

  9. 이홍식, '국어문장의 주성분 연구', 서울대학교 박사학위논문, 1996 

  10. 이휘봉, '구문의존구조에서 중간언어 방식 기계번역을 위한 개념그래프의 생성', 포항공과대학교 전자계산학과 박사학위논문, 1998 

  11. 이회자, 이종희, '사전식 텍스트분석적 국어 조사의 연구', 한국문화사, 1998 

  12. 조일영, ''NP로'의 의미역', 제16차 한국어학회 전국 학술 대회, pp.56-65, 1998 

  13. 조정미, 김길창, '한국어 의미 해석시 중의성 해소에 대한 연구', 정보과학회지, 제14권 제7호, pp.71-83, 1996 

  14. D. Gildea and D. Jurafsky, 'Automatic Labeling of Semantic Roles,' In Proceedings of the 38th Annual Meeting of Association of Computational Linguistics, Hong Kong, pp.512-520, 2000 

  15. J. F. Sowa, 'Using a Lexicon of Canonical Graphs in a Semantic Interpreter,' in Relational Models of the Lexicon : Representing knowledge in Semantic Networks, Edited by M. W. Evens, Cambridge University Press, pp.113-138, 1988 

  16. K. H. Moon and J. H. Lee, 'Representation and Recognition Method for Multi-Word Translation Units in Korean-to-Japanese MT System,' In the 18th International Conference on Computational Linguistics (COLING 2000), Germany, pp.544-550, 2000 

  17. M. Y. Kim, S. J. Kang and J. H. Lee, 'Resolving Ambiguity in Inter-chunk Dependency Parsing,' NLPRS 2001 (6th Natural Language Processing Pacific Rim Symposium), Tokyo, Japan, pp.263-270, Nov., 2001 

  18. S. B. Park and Y. T. Kim, 'Semantic Role Determination in Korean Relative Clauses using Idiomatic Patterns,' In Proceedings of the 17th International Conference on Computer Processing of Oriental Languages, pp.1-6, 1997 

  19. S. Ohno and M. Hamanishi, 'New Synonyms Dictionary,' Kadokawa Shoten, Tokyo, 1981.(Written in Japanese) 

  20. Y. J. Chung, S. J. Kang, K. H. Moon and J. H. Lee, 'Word Sense Disambiguation Using Neural Networks with Concept Co-occurrence Information,' NLPRS 2001 (6th Natural Language Processing Pacific Rim Symposium), Tokyo, Japan, pp.715-722, Nov., 2001 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로