[논문]문학 텍스트에서 프→한 기계번역 정확도 평가와 오류 유형 분석

손승희

문학 텍스트에서 프→한 기계번역 정확도 평가와 오류 유형 분석
L’évaluation de la précision et de l’analyse des types d’erreurs effectués par la traduction automatique français-coréen dans les textes littéraires 원문보기

손승희 (부산대학교 대학원 불어불문학과 국내석사)

초록 ▼
AI-Helper

신경망 기계번역 방법론이 출현하면서 기계번역의 정확도가 기하급수적으로 높아졌다. 또한 기계번역의 오류를 인간이 보완하는 번역 방식인 포스트에디팅이 번역시장에서 점점 확대되면서 기계번역의 활용에 대한 연구도 활발히 진행되었다. 그러나 연구대상은 대체로 비문학 텍스트에 집중되었고 문학 텍스트는 여전히 기계번역이 가능한 대상에서 제외되었다.
본고의 목적은 정확도 평가를 통해 문학 텍스트에서 프->한 기계번역의 가능성을 검토하고, 기계번역 결과의 오류 유형을 분석하는 데에 있다. 평가 대상으로는 19세기 이후에 출판된 프랑스어 희곡, 소설, 전기(에세이) 장르에서 하나씩을 골라 세 작품을 선정하였다. 각 작품에서 230여 문장씩을 추출하여 평가말뭉치를 구성하고, 구글 신경망 기계번역기를 사용해 한국어로 번역한 후, 번역 결과를 전문가의 번역서와 비교하는 방식으로 정확도 평가가 이루어졌다. 그 결과, 정확도 10점 만점에 희곡 7.0점, 소설 8.6점, 전기 7.7점으로 전체 정확도는 7.78점이었다. 이는 선행연구에서 측정한 비문학 텍스트의 정확도인 8.1점과 차이가 크게 나지 않았다. 또한 오류 유형 분석을 통해, 장르별로 출현 오류의 양상이 상이하다는 점을 관찰할 수 있었다. 이 차이는 해당 장르에서 쓰이는 문체와 용어에 기인한 것으로 보인다.
문학 텍스트의 기계번역 결과가 비문학 텍스트의 결과와 비슷한 정확도를 보이면서, 포스트에디팅이 가능하다는 점을 확인할 수 있었다. 따라서 비문학 텍스트와 동일하게 언어학적 오류를 보완할 인간의 역할이 필요하며, 무엇보다 문학적 능력을 갖춘 전문가의 수정이 필수적이다. 그러므로 미래에 기계번역과 공존해야하는 프랑스어 학습자들에게, 맥락, 문화소, 문체 등 기계번역이 번역 불가능한 부분을 학습하고, 본고에서 지적한 언어학적 오류를 능숙하게 파악하고 수정하는 능력을 기를 수 있는 교육이 필요해 보인다.

Abstract ▼ AI-Helper

La précision de la technologie de traduction automatique (TA) a augmenté de façon exponentielle avec l'avènement des méthodologies de la traduction automatique neuronale (TAN). En outre, la post-édition, qui peut se définir comme la méthode de traduction au travers de laquelle les humains compensent les erreurs de la TA, se développe de plus en plus sur le marché de la traduction. Dans la mesure où la précision de la TAN s’accroît, des études ont été activement menées. Il convient néanmoins de rappeler que les objectifs de recherche s’axaient avant tout sur des textes de type non-littéraire, ceux de type littéraire devant demeurer en-dehors de la mise en application de la TA.
Cette étude a pour objectif d’examiner la faisabilité de la TA en langue française et en langue coréenne pour les textes littéraires en évaluant sa précision et en analysant ses types d’erreurs. Afin de bien évaluer les capacités de cette technologie, nous avons sélectionné trois œuvres parmi des pièces de théâtre, des romans et des biographies en français, œuvres publiées après le 19e siècle. Le corpus d’évaluation se compose d’environ 230 phrases pour 3 genres chacun. Notre évaluation s’appuie sur la comparaison avec les traductions de Google Translation avec les traductions effectuées par des professionnels humains. Les résultats ne manquent pas d’intérêt : le genre textuel qui présente la note la plus élevée est le roman (8.6 /10) ; vient ensuite la biographie (7.7) et, pour finir, la pièce de théâtre (7.0), en moyenne 7.78. Nous avons par ailleurs constaté qu’il n'y avait pas de différence significative avec la précision de textes non-littéraires (effectivement, selon des études antérieures, leur note était de 8.1 / 10). En analysant les types d’erreurs, nous avons remarqué que l’apparition d’erreurs différait selon les genres textuels. Cette différence semble due au style et à la terminologie propres à chaque genre.
La comparaison des résultats de l’application de la TA dans les textes littéraires et non-littéraires montre que la post-édition se révèle également applicable pour les textes littéraires. Comme pour les textes non-littéraires, nous constatons qu’une intervention humaine ayant pour but de compenser les erreurs linguistiques se révèle nécessaire, et surtout, que la correction d’experts ayant des connaissances en littérature ne saurait être négligée. Par conséquent, il nous paraît, d’une part, nécessaire de rappeler les apprenants en langue française les éléments littéraires (tels que le contexte, la culture et le style) qu’elle ne peut intégrer et d’autre part, d’identifier et de corriger les erreurs linguistiques mises en valeur dans ce étude.

주제어

학위논문 정보

저자	손승희
학위수여기관	부산대학교 대학원
학위구분	국내석사
학과	불어불문학과
지도교수	윤애선
발행연도	2022
총페이지	v, 81 장
키워드	기계번역 문학 기계번역 정확도 평가 오류 유형 분석 포스트에디팅
언어	kor
원문 URL	http://www.riss.kr/link?id=T16458501&outLink=K
정보원	한국교육학술정보원

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명(한글), 저자명(한글), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문) 관리번호, 논문명(한글), 논문명(영문), 저자명(한글), 저자명(영문), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문)
저장형식	Text(ASCII format) Excel format
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

문학 텍스트에서 프→한 기계번역 정확도 평가와 오류 유형 분석
L’évaluation de la précision et de l’analyse des types d’erreurs effectués par la traduction automatique français-coréen dans les textes littéraires 원문보기

초록 ▼
AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

문학 텍스트에서 프→한 기계번역 정확도 평가와 오류 유형 분석 L’évaluation de la précision et de l’analyse des types d’erreurs effectués par la traduction automatique français-coréen dans les textes littéraires 원문보기

초록 ▼ 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

문학 텍스트에서 프→한 기계번역 정확도 평가와 오류 유형 분석
L’évaluation de la précision et de l’analyse des types d’erreurs effectués par la traduction automatique français-coréen dans les textes littéraires 원문보기

초록 ▼
AI-Helper