문학 텍스트에서 프→한 기계번역 정확도 평가와 오류 유형 분석 L’évaluation de la précision et de l’analyse des types d’erreurs effectués par la traduction automatique français-coréen dans les textes littéraires원문보기
신경망 기계번역 방법론이 출현하면서 기계번역의 정확도가 기하급수적으로 높아졌다. 또한 기계번역의 오류를 인간이 보완하는 번역 방식인 포스트에디팅이 번역시장에서 점점 확대되면서 기계번역의 활용에 대한 연구도 활발히 진행되었다. 그러나 연구대상은 대체로 비문학 텍스트에 집중되었고 문학 텍스트는 여전히 기계번역이 가능한 대상에서 제외되었다. 본고의 목적은 정확도 평가를 통해 문학 텍스트에서 프->한 기계번역의 가능성을 검토하고, 기계번역...
신경망 기계번역 방법론이 출현하면서 기계번역의 정확도가 기하급수적으로 높아졌다. 또한 기계번역의 오류를 인간이 보완하는 번역 방식인 포스트에디팅이 번역시장에서 점점 확대되면서 기계번역의 활용에 대한 연구도 활발히 진행되었다. 그러나 연구대상은 대체로 비문학 텍스트에 집중되었고 문학 텍스트는 여전히 기계번역이 가능한 대상에서 제외되었다. 본고의 목적은 정확도 평가를 통해 문학 텍스트에서 프->한 기계번역의 가능성을 검토하고, 기계번역 결과의 오류 유형을 분석하는 데에 있다. 평가 대상으로는 19세기 이후에 출판된 프랑스어 희곡, 소설, 전기(에세이) 장르에서 하나씩을 골라 세 작품을 선정하였다. 각 작품에서 230여 문장씩을 추출하여 평가말뭉치를 구성하고, 구글 신경망 기계번역기를 사용해 한국어로 번역한 후, 번역 결과를 전문가의 번역서와 비교하는 방식으로 정확도 평가가 이루어졌다. 그 결과, 정확도 10점 만점에 희곡 7.0점, 소설 8.6점, 전기 7.7점으로 전체 정확도는 7.78점이었다. 이는 선행연구에서 측정한 비문학 텍스트의 정확도인 8.1점과 차이가 크게 나지 않았다. 또한 오류 유형 분석을 통해, 장르별로 출현 오류의 양상이 상이하다는 점을 관찰할 수 있었다. 이 차이는 해당 장르에서 쓰이는 문체와 용어에 기인한 것으로 보인다. 문학 텍스트의 기계번역 결과가 비문학 텍스트의 결과와 비슷한 정확도를 보이면서, 포스트에디팅이 가능하다는 점을 확인할 수 있었다. 따라서 비문학 텍스트와 동일하게 언어학적 오류를 보완할 인간의 역할이 필요하며, 무엇보다 문학적 능력을 갖춘 전문가의 수정이 필수적이다. 그러므로 미래에 기계번역과 공존해야하는 프랑스어 학습자들에게, 맥락, 문화소, 문체 등 기계번역이 번역 불가능한 부분을 학습하고, 본고에서 지적한 언어학적 오류를 능숙하게 파악하고 수정하는 능력을 기를 수 있는 교육이 필요해 보인다.
신경망 기계번역 방법론이 출현하면서 기계번역의 정확도가 기하급수적으로 높아졌다. 또한 기계번역의 오류를 인간이 보완하는 번역 방식인 포스트에디팅이 번역시장에서 점점 확대되면서 기계번역의 활용에 대한 연구도 활발히 진행되었다. 그러나 연구대상은 대체로 비문학 텍스트에 집중되었고 문학 텍스트는 여전히 기계번역이 가능한 대상에서 제외되었다. 본고의 목적은 정확도 평가를 통해 문학 텍스트에서 프->한 기계번역의 가능성을 검토하고, 기계번역 결과의 오류 유형을 분석하는 데에 있다. 평가 대상으로는 19세기 이후에 출판된 프랑스어 희곡, 소설, 전기(에세이) 장르에서 하나씩을 골라 세 작품을 선정하였다. 각 작품에서 230여 문장씩을 추출하여 평가말뭉치를 구성하고, 구글 신경망 기계번역기를 사용해 한국어로 번역한 후, 번역 결과를 전문가의 번역서와 비교하는 방식으로 정확도 평가가 이루어졌다. 그 결과, 정확도 10점 만점에 희곡 7.0점, 소설 8.6점, 전기 7.7점으로 전체 정확도는 7.78점이었다. 이는 선행연구에서 측정한 비문학 텍스트의 정확도인 8.1점과 차이가 크게 나지 않았다. 또한 오류 유형 분석을 통해, 장르별로 출현 오류의 양상이 상이하다는 점을 관찰할 수 있었다. 이 차이는 해당 장르에서 쓰이는 문체와 용어에 기인한 것으로 보인다. 문학 텍스트의 기계번역 결과가 비문학 텍스트의 결과와 비슷한 정확도를 보이면서, 포스트에디팅이 가능하다는 점을 확인할 수 있었다. 따라서 비문학 텍스트와 동일하게 언어학적 오류를 보완할 인간의 역할이 필요하며, 무엇보다 문학적 능력을 갖춘 전문가의 수정이 필수적이다. 그러므로 미래에 기계번역과 공존해야하는 프랑스어 학습자들에게, 맥락, 문화소, 문체 등 기계번역이 번역 불가능한 부분을 학습하고, 본고에서 지적한 언어학적 오류를 능숙하게 파악하고 수정하는 능력을 기를 수 있는 교육이 필요해 보인다.
La précision de la technologie de traduction automatique (TA) a augmenté de façon exponentielle avec l'avènement des méthodologies de la traduction automatique neuronale (TAN). En outre, la post-édition, qui peut se définir comme la méthode de traduction au travers de laquelle les humains compensent...
La précision de la technologie de traduction automatique (TA) a augmenté de façon exponentielle avec l'avènement des méthodologies de la traduction automatique neuronale (TAN). En outre, la post-édition, qui peut se définir comme la méthode de traduction au travers de laquelle les humains compensent les erreurs de la TA, se développe de plus en plus sur le marché de la traduction. Dans la mesure où la précision de la TAN s’accroît, des études ont été activement menées. Il convient néanmoins de rappeler que les objectifs de recherche s’axaient avant tout sur des textes de type non-littéraire, ceux de type littéraire devant demeurer en-dehors de la mise en application de la TA. Cette étude a pour objectif d’examiner la faisabilité de la TA en langue française et en langue coréenne pour les textes littéraires en évaluant sa précision et en analysant ses types d’erreurs. Afin de bien évaluer les capacités de cette technologie, nous avons sélectionné trois œuvres parmi des pièces de théâtre, des romans et des biographies en français, œuvres publiées après le 19e siècle. Le corpus d’évaluation se compose d’environ 230 phrases pour 3 genres chacun. Notre évaluation s’appuie sur la comparaison avec les traductions de Google Translation avec les traductions effectuées par des professionnels humains. Les résultats ne manquent pas d’intérêt : le genre textuel qui présente la note la plus élevée est le roman (8.6 /10) ; vient ensuite la biographie (7.7) et, pour finir, la pièce de théâtre (7.0), en moyenne 7.78. Nous avons par ailleurs constaté qu’il n'y avait pas de différence significative avec la précision de textes non-littéraires (effectivement, selon des études antérieures, leur note était de 8.1 / 10). En analysant les types d’erreurs, nous avons remarqué que l’apparition d’erreurs différait selon les genres textuels. Cette différence semble due au style et à la terminologie propres à chaque genre. La comparaison des résultats de l’application de la TA dans les textes littéraires et non-littéraires montre que la post-édition se révèle également applicable pour les textes littéraires. Comme pour les textes non-littéraires, nous constatons qu’une intervention humaine ayant pour but de compenser les erreurs linguistiques se révèle nécessaire, et surtout, que la correction d’experts ayant des connaissances en littérature ne saurait être négligée. Par conséquent, il nous paraît, d’une part, nécessaire de rappeler les apprenants en langue française les éléments littéraires (tels que le contexte, la culture et le style) qu’elle ne peut intégrer et d’autre part, d’identifier et de corriger les erreurs linguistiques mises en valeur dans ce étude.
La précision de la technologie de traduction automatique (TA) a augmenté de façon exponentielle avec l'avènement des méthodologies de la traduction automatique neuronale (TAN). En outre, la post-édition, qui peut se définir comme la méthode de traduction au travers de laquelle les humains compensent les erreurs de la TA, se développe de plus en plus sur le marché de la traduction. Dans la mesure où la précision de la TAN s’accroît, des études ont été activement menées. Il convient néanmoins de rappeler que les objectifs de recherche s’axaient avant tout sur des textes de type non-littéraire, ceux de type littéraire devant demeurer en-dehors de la mise en application de la TA. Cette étude a pour objectif d’examiner la faisabilité de la TA en langue française et en langue coréenne pour les textes littéraires en évaluant sa précision et en analysant ses types d’erreurs. Afin de bien évaluer les capacités de cette technologie, nous avons sélectionné trois œuvres parmi des pièces de théâtre, des romans et des biographies en français, œuvres publiées après le 19e siècle. Le corpus d’évaluation se compose d’environ 230 phrases pour 3 genres chacun. Notre évaluation s’appuie sur la comparaison avec les traductions de Google Translation avec les traductions effectuées par des professionnels humains. Les résultats ne manquent pas d’intérêt : le genre textuel qui présente la note la plus élevée est le roman (8.6 /10) ; vient ensuite la biographie (7.7) et, pour finir, la pièce de théâtre (7.0), en moyenne 7.78. Nous avons par ailleurs constaté qu’il n'y avait pas de différence significative avec la précision de textes non-littéraires (effectivement, selon des études antérieures, leur note était de 8.1 / 10). En analysant les types d’erreurs, nous avons remarqué que l’apparition d’erreurs différait selon les genres textuels. Cette différence semble due au style et à la terminologie propres à chaque genre. La comparaison des résultats de l’application de la TA dans les textes littéraires et non-littéraires montre que la post-édition se révèle également applicable pour les textes littéraires. Comme pour les textes non-littéraires, nous constatons qu’une intervention humaine ayant pour but de compenser les erreurs linguistiques se révèle nécessaire, et surtout, que la correction d’experts ayant des connaissances en littérature ne saurait être négligée. Par conséquent, il nous paraît, d’une part, nécessaire de rappeler les apprenants en langue française les éléments littéraires (tels que le contexte, la culture et le style) qu’elle ne peut intégrer et d’autre part, d’identifier et de corriger les erreurs linguistiques mises en valeur dans ce étude.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.