$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

제한된 도메인에 특화된 기계번역 기술 개발 - 특허 전문 영한 번역기를 중심으로 -
Development of Machine Translation Technology Customized at Restricted Domain - Focusing on English-Korean Patent Translator - 원문보기

한국정보처리학회 2007년도 제27회 춘계학술발표대회, 2007 May 11, 2007년, pp.687 - 689  

최승권 (한국전자통신연구원 언어처리연구팀) ,  박은진 (한국전자통신연구원 언어처리연구팀) ,  김영길 (한국전자통신연구원 언어처리연구팀)

초록

본 논문은 2005 년부터 2006 년도까지 정보통신부의 지원 하에 한국전자통신연구원 언어처리연구팀에서 성공적으로 개발하여 현재 산업자원부 특허지원센터에서 대용량의 영어 특허문서를 대상으로 한국어 자동번역 서비스를 제공하고 있는 특허 전문 영한 번역기에 대해 기술한다. 특히 본 논문에서는 일반 도메인을 대상으로 한 기존의 영한 번역기를 제한된 도메인을 대상으로 한 영한번역기로 개량하고자 할 때, 개량하는 방법으로써 제한된 도메인에 대한 특화 절차에 대해서 기술한다. 이와 같이 특화 절차에 따라 구축된 특허 전문 영한 번역기 번역률을 특허 분야 중에 주요 5개 분야(기계, 전기전자, 화학일반, 의료위생, 컴퓨터)에 대해 특허전문번역가가 평가한 결과, 평균 82.43%가 나왔다. 또한 전기전자 분야 특허문서를 대상으로 특허 전문 영한 번역기와 일반 도메인을 대상으로 한 영한 번역기와의 번역률을 평가한 결과, 특허 전문 영한 번역기는 82.20%, 일반 도메인 대상 영한 번역기는 54.25%의 번역률을 내어, 특허에 특화된 특허 전문 영한 번역기가 특화되지 않은 일반 도메인의 영한 번역기에 비해 27.95%나 더 높은 결과를 알 수 있었다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 2005 년도부터 2006 년도까지 정보통신부의 지원 하에 한국전자통신연구원 언어처리연구팀에서 성공적으로 개발하여 현재 산업자원부 특허지원센터 (http://www.ipac.or.kr) 에서 대용량의 영어 특허문서를 대상으로 한국어 자동번역 서비스를 제공하고있으며, 가까운 시일 내에 특허청에서도 영한 특허문서 자동번역 서비스를 개시하게 될 특허 전문 영한번역기를 기술하는 것을 목표로 한다.
  • 본 논문에서는 일반 도메인을 대상으로 한 영한 번역기를 특허 도메인을 대상으로 한 영한 번역기로 특화하는 절차 및 그에 따른 번역률 향상 결과를 살펴보았다. 특허 전문 영한 번역기로의 특화 절차는 다음과 같은 절차로 이루어진다: 1) 대용량 영어 특허 문서에 대한 언어적 특성 분석, 2) 대용량 영어 특허 문서를 대상으로 한 전문용어의 자동 추출 및 반자동대역어 구축, 3) 기존 전문용어 사전의 대역어 튜닝, 4) 영어 특허 고유의 특허 번역 패턴 자동 추출 및 반자동 대역 패턴 구축, 5) 언어적 특성 분석에 따른 번역 엔진 모듈의 특화 및 개선, 6) 특화된 번역 지식 및 번역 엔진 모듈에 따른 임의의 특허 문서 대상 번역률 평가.
  • 본 장에서는 특허 전문 영한 번역기의 특허 분야별 번역률 평가 결과를 기술하고자 한다. 특허 분야별 평가 결과를 비교하기 위해 사용한 평가 코퍼스, 평가 방법, 평가 기준을 기술하면 다음과 같다:

가설 설정

  • 그 결과 일반 도메인보다도상당히 유용한 번역 결과를 생성해 낼 수 있었다.[1] 그 이유는 제한된 도메인의 문서가 일반 도메인에서의 문서보다 자동번역을 하는데 있어서 다음과 같은장점을 가지기 때문에 가능했다: 1) 제한된 도메인에는 동형이의어(homography)가 나타나면 하나의 특정의미로 사용된다. 2) 제한된 도메인에는 대역어 선택모호성이 일반 도메인에서보다 덜하다 3) 제한된 도메인에는 구조적 편향성 때문에 구조적 모호성이 상당 부분 해결된다.
  • [1] 그 이유는 제한된 도메인의 문서가 일반 도메인에서의 문서보다 자동번역을 하는데 있어서 다음과 같은장점을 가지기 때문에 가능했다: 1) 제한된 도메인에는 동형이의어(homography)가 나타나면 하나의 특정의미로 사용된다. 2) 제한된 도메인에는 대역어 선택모호성이 일반 도메인에서보다 덜하다 3) 제한된 도메인에는 구조적 편향성 때문에 구조적 모호성이 상당 부분 해결된다.
본문요약 정보가 도움이 되었나요?
LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로