$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

`단어-의미 의미-단어` 관계에 기반한 번역어 선택
Translation Disambiguation Based on 'Word-to-Sense and Sense-to-Word' Relationship 원문보기

정보처리학회논문지. The KIPS transactions. Part B. Part B, v.13B no.1 = no.104, 2006년, pp.71 - 76  

이현아 (금오공과대학교 컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

기계번역에서 올바른 번역 문장을 구성하기 위해서는 원시 문장의 의미를 올바르게 표현하면서 자연스러운 목적 문장을 구성하는 번역어를 선택해야 한다. 본 논문에서는 '단어-의미 의미-단어' 관계, 즉 원시언어의 한 단어는 하나 이상의 의미를 가지고 각 의미는 각기 다른 목적언어 단어로 표현된다는 점에 기반하여, 원시 단어의 의미 분별과 목적 단어 선택을 결합하여 번역어를 선택하는 방식을 제안한다. 기존의 번역방식은 원시 단어에 대한 목적단어를 직접 선택하는 '단어-단어' 관계에 기반하고 있기 때문에, 원시언어를 목적 언어로 직접 대응시키기 위한 지식을 필요로 하여 지식 획득에 어려움이 있었다. 본 논문의 방식에서는 원시 단어의 의미 분별과 목적 언어의 단어 선택의 결합을 통해 번역어를 선택함으로써, 손쉽게 획득할 수 있는 원시 언어와 목적 언어 각각의 지식원에서 번역어 선택을 위한 지식을 자동으로 추출할 수 있다. 또한 원시 언어의 의미와 목적 언어의 쓰임새를 모두 반영하여 충실도와 이해도를 모두 만족시키는 보다 정확한 번역어를 선택할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

To obtain a correctly translated sentence in a machine translation system, we must select target words that not only reflect an appropriate meaning in a source sentence but also make a fluent sentence in a target language. This paper points out that a source language word has various senses and each...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 기계번역(machine translation, MT)은 원시언어(source lan- guage)의 문서를 번역하여 목적 언어 (target language)의 문서를 얻는 것을 목표로 한다. 기계번역의 입력으로 들어오는 원시 언어 문장의 각 단어에 대응되는 여러 목적단어 중에서 올바른 번역문장을 구성하는 단어를 선택하는 문제를 번역 애매성 해소 (translation disambiguation), 또는 번역어 선택 (translation se- lection) 이라 한다.
  • 본 논문에서 제안하는 역어 선택 방식의 평가를 위한 실험을 수행하였다. 평가에서는 객관적인 평가 결과를 얻기 위해서 사람의 수작업을 배제하고 병렬코퍼스와 사전을 이용하여 자동으로 추출한 평가 집합에 대해서 자동으로 역어 선택 결과를 평가하였다.
  • 본 논문에서는 '단어-의미 의미-단어' 대응관계에 기반하여 원 시언어의 의미분별과 목적 언어의 단어 선택의 과정을 통해서 번 역어를 선택할 것을 제안하였다. 원시 언어의 의미를 반영하면서 자연스러운 목적 언어를 구성하는 단어를 선택하므로 충실도와 이해도를 모두 만족시킬 수 있는 방식으로, 병렬 코퍼스를 이용한 자동 평가에서 '단어-단어' 기반 방식보다 좋은 결과를 보였다.
  • 본 논문에서는 '단어-의미의 미-단어' 대응관계에 기반하여 의미분별과 단어 선택을 결합하여 번역어를 선택할 것을 제안한다. 역어 선택은 원시 문장의 각 단어의 의미를 분별하고, 분별된 의미에 대응되는 번역어 중에서 가장 적합한 단어를 선택하는 과정으로 수행된다.
  • 'break this window' 에서 'break'의 의미가 destroy이고 '꺾다'는 destroy의 의미에 대응되는 단어이지만, 이 문장을 '창문을 꺾다'로 번역하면 원문의 의미를 이해하기 어렵다. 본 논문에서는 목적단어의 공기 빈도를 이용하여 분별된 원시단어의 의미에 대응하는 단어 중에서 가장 적절한 단어를 번역어로 선택한다. 따라서, 올바른 의미를 가지면서 자연스러운 목적문장을 구성하는, 즉 이해도(intelligibility)가 높은 번역어를 선택할 수 있다.
  • 예제에서 살펴본 바와 같이, 정확한 번역어를 선택하기 위해서는 원시언어 문장에서의 의미에 맞으면서 목적 언어 문장을 자연스럽게 만드는 번역어를 선택하여야 한다. 본 논문에서는 이 점에 기반하여 원시단어의 의미분별과 목적단어의 선택을 결합하여 번역어를 선택할 것을 제안한다.
  • 본 논문에서는 지식 획득이 쉬우면서 정확한 번역어를 선택하기 위한 새로운 방법을 제안한다. 원시언어의한 단어는 하나 이상의 의미를 가지고 각 의미는 각기 다른 목적 언어 단어로 표현되는 '단어-의미 의미-단어' 관계에, 원시단어의 의미분별과 목적단어의 선택을 결합하여 번역어를 선택한다.
  • 충실도와 이해 도는 각각 원시언어와 목적 언어의 측면에서 번역 결과를 평가하는 척도이다. 충실도는 원시언어 문장의 정보가 번역된 문장으로 정확하고 완전하게 전달되는지를 평가한다. 이해도는 목적언 어 사용자가 보았을 때 번역된 문장이 자연스럽고 유창(fluent)하게 구성되어 쉽게 이해할 수 있는지를 평가한다.

가설 설정

  • · 문제 복합도의 감소 : (그림 1)에서 볼 수 있듯이, 단어당 번역어 수는 단어당 의미 수에 비해 큰 값을 가지고, 그 값은 실제 문서에서 자주 나타나는 단어일수록 높아진다. 기존의 역어선 택에 대한 연구들을 원시단어를 직접 목적단어로 대응시킨다.
  • · 용이한 지식 획득 : 역어 선택은 원시언어를 목적 언어에 대응시키는 문제이므로, 단일언어를 대상으로 하는 문제에 비해 지식 획득이 더 어렵다. 기존의 역어 선택 방식은 원시단어를 목적단어로 직접 대응시키기 때문에, 번역을 위한 지식을 자동으로 추출하기 위해서는 양 언어가 연결된 형태의 복잡한 지식 원, 즉 수동으로 구축한 복잡한 지식 베이스나 병렬코퍼스와 같이 획득하기 어려운 지식원을 요구한다.
  • · 자연스러운 목적문장 생성 : 올바른 의미에 대한 번역어들이 항상 바른 번역 문장을 만들지는 않는다. 'break this window' 에서 'break'의 의미가 destroy이고 '꺾다'는 destroy의 의미에 대응되는 단어이지만, 이 문장을 '창문을 꺾다'로 번역하면 원문의 의미를 이해하기 어렵다.
본문요약 정보가 도움이 되었나요?

참고문헌 (7)

  1. John White and Teri O'Connell, 'Machine Translation Evaluation', Tutorial, the Second Conference of Association for Machine Translation in the Americas, 1996 

  2. Bonnie J. Dorr and Pamela W. Jordan and John W. Benoit, 'A Survey of Current Research in Machine Translation', 1-68, Advances in Computers, M. Zelkowitz (Ed). Academic Press, London, 1999 

  3. Philipp Koehn and Kevin Knight, 'Knowledge Sources for Word-Level Translation Models', Proceedings, Empirical Methods in Natural Language Processing, 2001 

  4. Ido Dagan and Alon Itai, 'Word Sense Disambiguation Using a Second Language Monoligual Corpus', 563-596, Vol.20, No.4, Computational Linguistics, 1994 

  5. 엣센스 영영한 사전, 민중서림,1995 

  6. German Rigau and Jordi Atserias and Eneko Agirre, 'Combining Unsupervised Lexical Knowledge Methods for Word Sense Disambiguation', Proceeding of Annual Meeting of the Association for Computational Linguistics, 1997 

  7. Geoffrey Towell and Ellen M. Voorhees, 'Disambiguating Highly Ambiguous Words', Computational Linguistics, Vol. 24, No.1, pp.125-147, 1998 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로