다문화 가정 구성원은 언어 차이 때문에 자녀 교육에서 어려움을 겪고 있다. 이와 같은 어려움을 해결하기 위해서는 실생활에 필요한 한국어 용어들을 간편하고 신속하게 접근할 수 있는 스마트 번역 서비스를 이들에게 제공할 필요가 있다. 그러나 현재의 자동 번역 기술은 영어, 중국어, 일본어 등의 주요 국가 언어 중심으로 개발 되고 있으며, 자녀의 교육, 공공기관과의 소통 등 특수 목적의 용어들은 번역하기에는 한계가 있다. 본 연구에서는 초급 수준의 한국어를 이해하고 있는 다문화가정 구성원을 위한 실시간 자동 어휘대역어 서비스를 제안한다. 어휘대역어 서비스는 한국어 문장에 표현된 각 단어들의 의미를 자동으로 분석하여 다국어 대역어를 제공한다. 이를 위하여 한국어 의미분석 연구, 다국어 번역지식 구축 연구, 언어교육 연구의 융합연구를 수행하였다. 어휘대역서비스를 베트남, 일본 출신의 결혼이주여성을 대상으로 평가하여 의미있는 평가결과를 얻었다.
다문화 가정 구성원은 언어 차이 때문에 자녀 교육에서 어려움을 겪고 있다. 이와 같은 어려움을 해결하기 위해서는 실생활에 필요한 한국어 용어들을 간편하고 신속하게 접근할 수 있는 스마트 번역 서비스를 이들에게 제공할 필요가 있다. 그러나 현재의 자동 번역 기술은 영어, 중국어, 일본어 등의 주요 국가 언어 중심으로 개발 되고 있으며, 자녀의 교육, 공공기관과의 소통 등 특수 목적의 용어들은 번역하기에는 한계가 있다. 본 연구에서는 초급 수준의 한국어를 이해하고 있는 다문화가정 구성원을 위한 실시간 자동 어휘대역어 서비스를 제안한다. 어휘대역어 서비스는 한국어 문장에 표현된 각 단어들의 의미를 자동으로 분석하여 다국어 대역어를 제공한다. 이를 위하여 한국어 의미분석 연구, 다국어 번역지식 구축 연구, 언어교육 연구의 융합연구를 수행하였다. 어휘대역서비스를 베트남, 일본 출신의 결혼이주여성을 대상으로 평가하여 의미있는 평가결과를 얻었다.
Multicultural family members have difficulty in educating their children due to language differences. In order to solve these difficulties, it is necessary to provide smart translation services that enable them easily and quickly access real-life vocabularies. However, the current automatic translat...
Multicultural family members have difficulty in educating their children due to language differences. In order to solve these difficulties, it is necessary to provide smart translation services that enable them easily and quickly access real-life vocabularies. However, the current automatic translation technology is being developed in dominant languages such as English, Chinese, and Japanese. There are also limitations to translating special-purpose terms such as documents of schools and instructions of public institutions. In this study, we propose a real-time automatic word translation service for multicultural family members who understand beginner level Korean. The service automatically analyzes the semantics of each word in the Korean sentences and provides a word-by-word translation. This study includes semantic analysis research for Korean language, building multilingual translation knowledge, and fusion study of language education. We evaluated the word translation service for migrant women from Vietnam and Japan and obtained meaningful evaluation results.
Multicultural family members have difficulty in educating their children due to language differences. In order to solve these difficulties, it is necessary to provide smart translation services that enable them easily and quickly access real-life vocabularies. However, the current automatic translation technology is being developed in dominant languages such as English, Chinese, and Japanese. There are also limitations to translating special-purpose terms such as documents of schools and instructions of public institutions. In this study, we propose a real-time automatic word translation service for multicultural family members who understand beginner level Korean. The service automatically analyzes the semantics of each word in the Korean sentences and provides a word-by-word translation. This study includes semantic analysis research for Korean language, building multilingual translation knowledge, and fusion study of language education. We evaluated the word translation service for migrant women from Vietnam and Japan and obtained meaningful evaluation results.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 연구에서는 가정통신문 도메인에 다국어 어휘대역 서비스를 적용하기 위하여 한국건강가정진흥원3)에서 제공하는 “다문화가족을 위한 초등학교 용어 풀이집”에 포함된 어휘와 가정통신문 코퍼스를 구축한 뒤 고빈도 어휘를 추출하여 각각 한국어 어휘의미분석 시스템의 성능을 개선하였고, 다국어 어휘 번역 지식을 확장하였다.
기존의 한국어 어휘 의미분석 모듈과 다국어 번역 지식은 특정 도메인을 가정하지 않고 있다. 본 연구는 다문화가정의 결혼이주 여성의 자녀들의 교육 및 학교생활에 도움을 주고자하는 목적이 있기 때문에 학교 가정통신문을 수집 및 분석하여 시스템을 평가한다.
본 연구에서는 기초적인 한국어 능력을 가진 다문화 가정 구성원 및 외국 관광객을 위한 어휘대역서비스를 제안하고 가능성을 보였다. 향후 오류 검증, 시스템 성능 개선, 대역지식 확장 등을 포함하는 성능 개선을 위한 프로세스를 확립하여 비전문가도 쉽게 서비스를 운영할 수 있도록 할 예정이고, 스마트폰 앱으로 출시하여 보급할 계획이다.
본 연구에서는 초급 수준의 한국어를 이해할 수 있는 다문화 가정의 결혼이주 여성, 한류 관광객 등을 위한 실시간 자동 어휘대역 서비스 시스템을 제안하고자 하며, 특히 동남아 국가언 어의 개발에 집중하고자 한다. 그림 1은 다국어 어휘대역서비 스의 예시이다.
어휘대역서비스 웹서비스(http://converge.bufs.ac.kr)를 개발 하여 국내에 거주하는 결혼이주여성을 대상으로 서비스를 평가하였다. 그림 6은 어휘대역 웹서비스 화면을 보여주고 있으며 영어, 일본, 프랑스, 스페인, 아랍, 몽골, 베트남, 태국, 인도네시아, 러시아, 중국 11개 언어에 대한 어휘 대역서비스를 제공하고 있다.
가설 설정
표 3은 지역별 국제결혼가정 자녀 현황 및 가정통신문 수집 건수를 보여 준다. 국제결혼 자녀들이 많이 거주하는 지역의 가정통신문을 기반으로 어휘를 분석하고 서비스를 개선하면 다문화가정의 언어사용 특징을 잘 반영할 수 있다고 가정하였다.
즉 한국어, 일본어 등 주요 언어 사이의 번역 성능이 베트남어와 같은 동남아시아 언어 번역보다 성능이 우수함을 볼 수 있다. 이 결과는 한국어 대상 동남아시아 언어로 자동번역 시스템은 아직 성능이 낮기 때문에 현 상황에서는 어휘수준의 번역이 필요하다는 본 연구의 기본 가정이 옳음을 보여준다.
제안 방법
결혼이주 여성을 대상 어휘 대역 서비스의 성능을 평가하였다. 일본, 베트남 국가별 5명 (전체 10명) 결혼이주 여성을 대상으로 가정통신문 한국어 문장 100개에 대한 어휘대역 결과를 각각 제시하고 1~5점 부여하도록 하였다.
따라서 본 연구에서는 가정통신문 도메인에 다국어 어휘대역 서비스를 적용하기 위하여 한국건강가정진흥원3)에서 제공하는 “다문화가족을 위한 초등학교 용어 풀이집”에 포함된 어휘와 가정통신문 코퍼스를 구축한 뒤 고빈도 어휘를 추출하여 각각 한국어 어휘의미분석 시스템의 성능을 개선하였고, 다국어 어휘 번역 지식을 확장하였다. 기존의 표준국어대사전과 한국어기초사전에 포함되지 않은 용어와, 가정통신문 특성 상 복합명사를 분리하지 않고 자체적인 대역어가 필요한 어휘를 추가하였다. 표 2는 가정통신문 도메인 어휘를 1) 가정통신문 전문 용어, 2) 가정통신문 신조어, 3) 가정통신문 고빈도 질병 이름의 예시를 보여준다.
한국어 어휘의미분석 결과에 대응하는 외국어 대역어를 제공하기 위하여, 표준국어대사전의 다의어 수준 어휘와 한국어 기초사전 어휘 사이의 정렬이 필요하다. 본 연구에서는 표준국 어대사전과 한국어 기초사전 어휘 사이의 뜻풀이 유사도를 이용하여 자동으로 맵핑하고, 나머지는 언어처리 및 어학을 전공한 전문가들이 수작업으로 정렬하였다. 그림 4는 “폭설”에 대한 두 사전의 의미 구분과 각 의미별 뜻풀이를 보여준다.
예시에서 “교장선생님에게” 어절은 세개의 형태소 “교장”, “선생님”, “에게”로 분할하고, 각각의 형태 소에 대해서 NNG(보통명사), NNG(보통명사), JKB(부사격조사) 태그를 부착하였다.
대상 데이터
가정통신문 코퍼스 수집을 위하여 부산, 울산, 경남 지역에서 국제결혼 자녀들의 현황을 분석 후, 국제결혼 가정 및 자녀가 다수 분포하는 지역의 가정통신문을 수집하였다. 표 3은 지역별 국제결혼가정 자녀 현황 및 가정통신문 수집 건수를 보여 준다.
결혼이주 여성을 대상 어휘 대역 서비스의 성능을 평가하였다. 일본, 베트남 국가별 5명 (전체 10명) 결혼이주 여성을 대상으로 가정통신문 한국어 문장 100개에 대한 어휘대역 결과를 각각 제시하고 1~5점 부여하도록 하였다. 또한 성능 비교를 위하여 구글번역기의 결과도 제시하고 마찬가지로 1~5점을 부여 하도록 하였다.
이론/모형
한국어 어휘의미분석 시스템은 표준국어대사전의 다의어 수준의 어휘 의미분석 결과를 제공한다. 본 연구에서는 국립국어원에서 구축한 한국어기초사전 다국어 버전2)을 번역지식으로 이용한다. 이 사전은 5만 여개의 한국어 기초 어휘에 10개 국어(영어, 일본어, 프랑스어, 스페인어, 아랍어, 몽골어, 베트 남어, 태국어, 인도네시아어, 러시아어) 대역어를 수록하고 있다.
마찬가지로 “교장/NNG” 는 “03: 각급 학교의 으뜸 직위”에 해당하기 때문에 의미번호 “03”을 할당하였고, “사과하/VV”는 “02: 잘못을 인정하고 용서를 빌다”에 해당하기 때문에 의미번호 “02”를 할당하였다. 본연구에서는 [17]에서 개발한 한국어 의미분석기를 적용하였다. 이 의미분석기는 표준국어대사전에서 정의한 표제어의 의미구분을 의미 분류의 기준으로 삼고 있다.
한국어 어휘의미분석을 위해서는 어휘의미망, 의미주석 말뭉치, 의미역 부착 격특사전, 의존관계 말뭉치 등의 어휘의미 자원이 필요하다. 적용 방법으로는 의미주석 말뭉치를 기반으로 Hidden Markov Model(HMM)을 이용한 기계학습 방법, 어휘 의미망을 이용한 어휘 간 의미제약 방법이 있다. 어휘의미망 기반 방법에서는 WordNet을 기반으로 하는 Korlex[18]와 표준국 어대사전을 기반으로 구축된 UWordMap[17]이 있다.
성능/효과
표 5는 결혼이주 여성 대상 성능 평가의 결과를 제시하고 있다. 어휘대역 서비스의 경우 일본어, 베트남어 모두 4점 이상을 받아서 초급 한국어 이해 능력이 있는 사용자에게 유용함을 보였다. 한편 구글 번역기의 경우 문장 전체를 번역하여 제시하기 때문에 어휘 번역 오류, 문장 구조 번역 오류가 중복되어 사용자가 상대적으로 결과를 이해하기 어렵기 때문에 상대적으로 낮은 평가를 받았다.
어휘의미망 기반 방법에서는 WordNet을 기반으로 하는 Korlex[18]와 표준국 어대사전을 기반으로 구축된 UWordMap[17]이 있다. 이 방법은 명사의 상위어와 용언의 하위범주화 정보를 이용하며, 말뭉 치기반의 방법에 비해서 앞으로 재현율 문제에서 유리한 측면이 많지만, 재현에 성공하더라도 정확률은 다소 낮은 것으로 확인되었다. 이런 문제를 해결하기 위해서 기존의 말뭉치기반 기계학습방법과 어휘의미망을 같이 사용하는 방법이 연구되었 고, 정확률이 조금 향상되는 것을 확인하였다.
초기 어휘대역서비스는 특정 도메인을 가정하지 않고 개발하였다. 즉, 한국어 어휘의미분석 모듈, 다국어 어휘번역지식은 표준국어대사전과 한국어기초사전 다국어버전을 기준으로 개발 및 구축되었다. 그러나 가정통신문과 같은 특정 도메인의 문장에 대한 어휘 대역 서비스를 위해서는 해당 도메인만 나타나거나 고빈도로 나타나는 어휘에 대한 어휘의미분석 성능 개선과 대역지식확장이 필요하다.
후속연구
향후 오류 검증, 시스템 성능 개선, 대역지식 확장 등을 포함하는 성능 개선을 위한 프로세스를 확립하여 비전문가도 쉽게 서비스를 운영할 수 있도록 할 예정이고, 스마트폰 앱으로 출시하여 보급할 계획이다. 또한 개체명 인식 기능 추가하여 인명, 지명, 조직명 등 번역이 필요없는 의미 단위를 인식하여 서비스를 개선할 예정이다.
본 연구에서는 기초적인 한국어 능력을 가진 다문화 가정 구성원 및 외국 관광객을 위한 어휘대역서비스를 제안하고 가능성을 보였다. 향후 오류 검증, 시스템 성능 개선, 대역지식 확장 등을 포함하는 성능 개선을 위한 프로세스를 확립하여 비전문가도 쉽게 서비스를 운영할 수 있도록 할 예정이고, 스마트폰 앱으로 출시하여 보급할 계획이다. 또한 개체명 인식 기능 추가하여 인명, 지명, 조직명 등 번역이 필요없는 의미 단위를 인식하여 서비스를 개선할 예정이다.
질의응답
핵심어
질문
논문에서 추출한 답변
한국어의 유형은?
한국어는 여러 형태소가 결합하여 하나의 어절을 이루는 교착어이다. 즉 하나의 어절이 여러 개의 형태소로 구성되어 있다.
결혼이민 및혼인귀화자의 구성은?
2015년 행정안전부 외국인 주민 현황에 따르면, 결혼이민 및혼인귀화자의 구성은 중국인 25.47%, 한국계 중국인 24.50%, 베트남인 24.05%, 필리핀인 6.97%, 일본인 5.34%, 캄보디아인 2.66%, 동구 유럽 출신 2.21%의 구성을 보이고 있으며, 동북아및 동남아 결혼 이민 및 귀화자가 증가하고 있는 추세이다[**]. 결혼이민 및 혼인 귀화자 중에 여성의 비율이 80%이상을 차지 하고, 다문화 가정 자녀들도 점차 증가하는 것으로 나타나고 있으며, 이에 따라 다문화 가정에서 나타나는 사회적인 문제들도 증가하고 있다.
다문화 가정 교육 서비스에 관한 연구는 무엇이 있었는가?
그러나 결혼이민자및 귀화자, 외국인 노동자들을 위한 교육 및 사회적 환경이 쌍방적이기 보다는 일방적인 교육 서비스 제공에 한정되어 있는 문제가 있다. 관련 연구로 결혼 이주여성과 그 자녀의 소통문제[3], 한국어 교육[4], 한국어 교육 정책[5], 다문화 가정 아동대상 한국어 교육[6], 다문화가정 자녀 한국어교육 및 학교 교육환경에 대한 교사 인식[7], 다문화가정 자녀의 학교생활에 관한 연구[8] 등이 있으며, 주로 다문화가정 자녀의 학교생활, 교사의 인식, 한국어 교육 등에 국한되어 있으며, 다문화가정의 주부와 학교 및 공공기관 간의 소통에 대한 연구는 부재한 실정이다. 일무 연구에서는 알림장, 가정통신문 등은 일반적인 상황에서 접하기 어려운 것들이며, 이를 바탕으로 교사에게 자녀 교육에 대한 상담을 해야 하는 복합적인 상황들의 경우 여성결혼이 민자의 부담은 더욱 커지고 있음을 지적하고 있다[9, 10].
※ AI-Helper는 부적절한 답변을 할 수 있습니다.