$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

자동통번역 시스템의 언어 현상별 자동 평가
Automatic Evaluation of Speech and Machine Translation Systems by Linguistic Test Points 원문보기

한국정보처리학회 2019년도 추계학술발표대회, 2019 Oct. 30, 2019년, pp.1041 - 1044  

최승권 (한국전자통신연구원 언어지능연구실) ,  최규현 (과학기술연합대학원대학교 컴퓨터소프트웨어) ,  김영길 (한국전자통신연구원 언어지능연구실)

초록
AI-Helper 아이콘AI-Helper

자동통번역의 성능을 평가하는데 가장 잘 알려진 자동평가 기술은 BLEU이다. 그러나 BLEU로는 자동통번역 결과의 어느 부분이 강점이고 약점인지를 파악할 수 없다. 본 논문에서는 자동통번역 시스템의 언어 현상별 자동평가 방법을 소개하고자 한다. 언어 현상별 자동평가 방법은 BLEU가 제시하지 못하는 언어 현상별 자동평가가 가능하며 개발자로 하여금 해당 자동통번역 시스템의 언어 현상별 강점과 약점을 직관적으로 파악할 수 있도록 한다. 언어 현상별 정확도 측정은 Google 과 Naver Papago 를 대상으로 실시하였다. 정확률이 40%이하를 약점이라고 간주할 때, Google 영한 자동번역기의 약점은 스타일(32.50%)번역이었으며, Google 영한 자동통역기의 약점은 음성(30.00%)인식, 담화(30.00%)처리였다. Google 한영 자동번역기 약점은 구문(34.00%)분석, 모호성(27.50%)해소, 스타일(20.00%)번역이었으며, Google 한영 자동통역기 약점은 담화(30.00%)처리였다. Papago 영한 자동번역기는 대부분 정확률이 55% 이상이었으며 Papago 영한 자동통역기의 약점은 담화(30.00%)처리였다. 또한 Papago 한영 자동번역기의 약점은 구문(38.00%)분석, 모호성(32.50%)해소, 스타일(20.00%)번역이었으며, Google 한영 자동통역기 약점은 담화(20.00%)처리였다. 언어 현상별 자동평가의 궁극적인 목표는 자동통번역기의 다양한 약점을 찾아내어 약점과 관련된 targeted corpus 를 반자동 수집 및 구축하고 재학습을 하여 자동통번역기의 성능을 점증적으로 향상시키는 것이다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 논문에서는 자동통번역 시스템의 장점과 단점을 자동으로 파악할 수 있는 방법인 언어 현상별 자동평가 방법을 제안하고자 한다. 언어 현상별 자동평가 방법에 의하면 BLEU 에서 제시하지 못하는 언어 현상별 자동평가가 가능하며 개발자 관점에서 자동통번역 시스템의 언어 현상별 장점과 단점을 직관적으로 파악하여 자동통번역 시스템의 단점을 개선할 수 있다.
  • 또한 본 논문의 언어 현상별 자동평가 방법과 같이 자동으로 평가하는 방법에 대한 연구가 있었다. 독-영 평가셋에서 평가대상이 되는 평가 현상을 정규식 표현(Regular expression)으로 기술하여 자동으로 평가하는 방법이었다[7]
  • 본 논문에 언어 현상별 평가 방법과 같이 자동번역 시스템의 장단점을 파악하기 위해 평가셋(Test suites)을 구축하는 연구가 있었다. Bentivogli [3]는형태소, 어휘, 어순과 관련된 IWSLT 2015 의 English-German 평가셋을 만들어 PBMT(Phrase-Based Machine Translation)와 NMT(Neural Machine Translation)의 장단점을 평가하였다.
  • 본 논문에서는 언어 현상별 자동평가 방법을 소개하였다. 자동통번역 시스템의 언어 현상별 자동평가 방법은 다음과 같이 이루어졌다.
  • 3) 원문을 자동번역 후, <평가어휘>가 자동번역문에 없으면 0 점을 부여한다. 이러한 언어 현상별 자동평가 방법에 따라 2 개의 자동통번역기를 평가하였으며 언어 현상별 자동평가 방법의 궁극적인 목표는 자동통번역기의 다양한 약점을 찾아내어 약점과 관련된 targeted corpus 를 반자동 수집 및 구축하고 재학습을 하여 자동통번역기의 성능을 점증적으로 향상시키는 것이다.
  • BLEU 의 장점은 평가하고자 하는 원문에 대해 정답인 번역문(Reference)이 존재하면 시스템을 자동으로 평가할 수 있다는 것이다. 즉, 원문에 대한 자동번역 결과를 정답인 번역문(Reference)과의 n-gram 유사도를 계산하여 자동으로 평가를 수행하는 것이다. 반면에 BLEU 의 단점은 평가 점수만 보고서는 해당 시스템의 문제점이 무엇인지를 파악할 수 없으며, 평가에 사용한 정답인 번역문에 의존적인 결과를 내린다는 것이다 [2].
본문요약 정보가 도움이 되었나요?

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로