[논문]자동통번역 시스템의 언어 현상별 자동 평가

최승권; 최규현; 김영길

자동통번역 시스템의 언어 현상별 자동 평가
Automatic Evaluation of Speech and Machine Translation Systems by Linguistic Test Points 원문보기

최승권 (한국전자통신연구원 언어지능연구실) , 최규현 (과학기술연합대학원대학교 컴퓨터소프트웨어) , 김영길 (한국전자통신연구원 언어지능연구실)

자동통번역의 성능을 평가하는데 가장 잘 알려진 자동평가 기술은 BLEU이다. 그러나 BLEU로는 자동통번역 결과의 어느 부분이 강점이고 약점인지를 파악할 수 없다. 본 논문에서는 자동통번역 시스템의 언어 현상별 자동평가 방법을 소개하고자 한다. 언어 현상별 자동평가 방법은 BLEU가 제시하지 못하는 언어 현상별 자동평가가 가능하며 개발자로 하여금 해당 자동통번역 시스템의 언어 현상별 강점과 약점을 직관적으로 파악할 수 있도록 한다. 언어 현상별 정확도 측정은 Google 과 Naver Papago 를 대상으로 실시하였다. 정확률이 40%이하를 약점이라고 간주할 때, Google 영한 자동번역기의 약점은 스타일(32.50%)번역이었으며, Google 영한 자동통역기의 약점은 음성(30.00%)인식, 담화(30.00%)처리였다. Google 한영 자동번역기 약점은 구문(34.00%)분석, 모호성(27.50%)해소, 스타일(20.00%)번역이었으며, Google 한영 자동통역기 약점은 담화(30.00%)처리였다. Papago 영한 자동번역기는 대부분 정확률이 55% 이상이었으며 Papago 영한 자동통역기의 약점은 담화(30.00%)처리였다. 또한 Papago 한영 자동번역기의 약점은 구문(38.00%)분석, 모호성(32.50%)해소, 스타일(20.00%)번역이었으며, Google 한영 자동통역기 약점은 담화(20.00%)처리였다. 언어 현상별 자동평가의 궁극적인 목표는 자동통번역기의 다양한 약점을 찾아내어 약점과 관련된 targeted corpus 를 반자동 수집 및 구축하고 재학습을 하여 자동통번역기의 성능을 점증적으로 향상시키는 것이다.

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

따라서 본 논문에서는 자동통번역 시스템의 장점과 단점을 자동으로 파악할 수 있는 방법인 언어 현상별 자동평가 방법을 제안하고자 한다. 언어 현상별 자동평가 방법에 의하면 BLEU 에서 제시하지 못하는 언어 현상별 자동평가가 가능하며 개발자 관점에서 자동통번역 시스템의 언어 현상별 장점과 단점을 직관적으로 파악하여 자동통번역 시스템의 단점을 개선할 수 있다.
또한 본 논문의 언어 현상별 자동평가 방법과 같이 자동으로 평가하는 방법에 대한 연구가 있었다. 독-영 평가셋에서 평가대상이 되는 평가 현상을 정규식 표현(Regular expression)으로 기술하여 자동으로 평가하는 방법이었다[7]
본 논문에 언어 현상별 평가 방법과 같이 자동번역 시스템의 장단점을 파악하기 위해 평가셋(Test suites)을 구축하는 연구가 있었다. Bentivogli [3]는형태소, 어휘, 어순과 관련된 IWSLT 2015 의 English-German 평가셋을 만들어 PBMT(Phrase-Based Machine Translation)와 NMT(Neural Machine Translation)의 장단점을 평가하였다.
본 논문에서는 언어 현상별 자동평가 방법을 소개하였다. 자동통번역 시스템의 언어 현상별 자동평가 방법은 다음과 같이 이루어졌다.
3) 원문을 자동번역 후, <평가어휘>가 자동번역문에 없으면 0 점을 부여한다. 이러한 언어 현상별 자동평가 방법에 따라 2 개의 자동통번역기를 평가하였으며 언어 현상별 자동평가 방법의 궁극적인 목표는 자동통번역기의 다양한 약점을 찾아내어 약점과 관련된 targeted corpus 를 반자동 수집 및 구축하고 재학습을 하여 자동통번역기의 성능을 점증적으로 향상시키는 것이다.
BLEU 의 장점은 평가하고자 하는 원문에 대해 정답인 번역문(Reference)이 존재하면 시스템을 자동으로 평가할 수 있다는 것이다. 즉, 원문에 대한 자동번역 결과를 정답인 번역문(Reference)과의 n-gram 유사도를 계산하여 자동으로 평가를 수행하는 것이다. 반면에 BLEU 의 단점은 평가 점수만 보고서는 해당 시스템의 문제점이 무엇인지를 파악할 수 없으며, 평가에 사용한 정답인 번역문에 의존적인 결과를 내린다는 것이다 [2].

제안 방법

언어 현상별 평가셋은 자동번역과 자동통역의 평가셋으로 구분하여 구축하였다. 자동번역을 위한 언어현상별 평가셋의 언어 현상 항목수는 58 개이고 해당 문장수는 630 문장이다 [8].
언어쌍은 영한과 한영에 대해 이루어졌다. 자동통역 시스템의 실험에 사용한 음성 데이터는 원본 동영상 파일을 2~3 분 단위로 자른 동영상클립의 음성인식 및 동시통역 자동분절 결과를 입력으로 간주하였다.

대상 데이터

실험에 사용된 자동통번역 시스템은 Google translator 와 Naver 의 Papago 였다. 언어쌍은 영한과 한영에 대해 이루어졌다.
자동번역을 위한 언어현상별 평가셋의 언어 현상 항목수는 58 개이고 해당 문장수는 630 문장이다 [8]. 자동통역을 위한 언어 현상별 평가셋의 언어 현상 항목수는 6 개이고 해당 문장수는 150 문장이다.

성능/효과

36% 높았다. Google 과 Papago 의 한영 자동통번역 언어현상별 정확률은 46.92% 대 49.06%로 Papago 의 정확률이 2.14% 높았다. 표 2 는 Google 과 Papago 의 자동번역과 자동통역 장단점도 일목요연하게 보여주고 있다.
표 2 는 Google 과 Papago 의 자동번역과 자동통역 장단점도 일목요연하게 보여주고 있다. 정확률이 40%이하를 약점이라고 간주할 때, Google 영한 자동번역기의 약점은 스타일(32.50%)번역이었으며, Google 영한 자동통역기의 약점은 음성(30.00%)인식, 담화(30.00%)처리였다. Google 한영 자동번역기 약점은 구문(34.
표 2 의 언어현상별 정확률에 따르면 Google 과 Papago 의 영한 언어현상별 자동통번역 정확률은 42.67% 대 57.03%로 Papago 의 정확률이 14.36% 높았다. Google 과 Papago 의 한영 자동통번역 언어현상별 정확률은 46.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

자동통번역 시스템의 언어 현상별 자동 평가
Automatic Evaluation of Speech and Machine Translation Systems by Linguistic Test Points 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

성능/효과

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

자동통번역 시스템의 언어 현상별 자동 평가 Automatic Evaluation of Speech and Machine Translation Systems by Linguistic Test Points 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

성능/효과

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

자동통번역 시스템의 언어 현상별 자동 평가
Automatic Evaluation of Speech and Machine Translation Systems by Linguistic Test Points 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper