[논문]Multi-Head Attention 방법을 적용한 문자 기반의 다국어 개체명 인식

천민아; 김창현; 박호민; 김재훈

Multi-Head Attention 방법을 적용한 문자 기반의 다국어 개체명 인식
Character-Aware Neural Networks with Multi-Head Attention Mechanism for Multilingual Named Entity Recognition 원문보기

한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회, 2018 Oct. 12, 2018년, pp.167 - 171

천민아 (한국해양대학교) , 김창현 (한국전자통신연구원) , 박호민 (한국해양대학교) , 김재훈 (한국해양대학교)

초록
AI-Helper

개체명 인식은 문서에서 인명, 지명, 기관명 등의 고유한 의미를 나타내는 단위인 개체명을 추출하고, 추출된 개체명의 범주를 결정하는 작업이다. 최근 개체명 인식과 관련된 연구는 입력 데이터의 앞, 뒤를 고려하기 위한 Bi-RNNs와 출력 데이터 간의 전이 확률을 이용한 CRFs를 결합한 방식을 기반으로 다양한 변형의 심층학습 방법론이 제안되고 있다. 그러나 대부분의 연구는 입력 단위를 단어나 형태소로 사용하고 있으며, 성능 향상을 위해 띄어쓰기 정보, 개체명 사전 자질, 품사 분포 정보 등 다양한 정보를 필요로 한다는 어려움이 있다. 본 논문은 기본적인 학습 말뭉치에서 얻을 수 있는 문자 기반의 입력 정보와 Multi-Head Attention을 추가한 Bi-GRU/CRFs을 이용한 다국어 개체명 인식 방법을 제안한다. 한국어, 일본어, 중국어, 영어에 제안 모델을 적용한 결과 한국어와 일본어에서는 우수한 성능(한국어 $F_1$ 84.84%, 일본어 $F_1$ 89.56%)을 보였다. 영어에서는 $F_1$ 80.83%의 성능을 보였으며, 중국어는 $F_1$ 21.05%로 가장 낮은 성능을 보였다.

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 논문에서는 Multi-Head Attention 방법을 적용한 Bi-GRU/CRFs를 이용하여 문자 기반의 입력을 통한 한국어, 일본어, 중국어, 영어의 개체명 인식을 실험하고 그 결과를 살펴봤다. 실험 결과 제안한 모델은 F₁ 점수를 기준으로 한국어에서 84.
그러나 대부분의 연구는 입력 단위를 단어나 형태소로 사용하고 있으며, 성능 향상을 위해 띄어쓰기 정보, 개체명 사전 자질, 품사 분포 정보 등 다양한 정보를 필요로 한다는 어려움이 있다[5-12]. 본 논문은 학습 말뭉치에서 얻을 수 있는 입력 정보의 조합과 Multi-Head Attention 방식[13]을 결합하여 다국어 개체명 인식에 적용하는 방법을 제안한다.

제안 방법

Bi-GRU의 각 층은 학습 시간을 단축과 mini-batch의 RNN의 성능 향상에 효과가 있는 레이어 정규화(layer normalization)[16]를 수행한다. 3) 레이어 정규화를 거친 Bi-GRU의 출력 결과를 Query와 Key로 사용하고, 각 Query와 Key의 차원을 Multi-Head Attention의 head 수만큼 분할한 후, 분할한 sub query와 sub key에 대해 attention을 구한다. 4) 3)에서 구한 head 수만큼의 attention을 하나로 합쳐서 Multi-Head Attention을 구성한다.
본 논문에서 제안하는 모델의 구조는 그림 1과 같다. 제안 모델의 태깅 단위는 문자이며, 각 문자에 대해 BIO(Begin, Inside, Outside)태그가 부착된 개체명 범주를 출력한다. 개체명이 시작되는 문자라면 (B-개체명 범주), 현재 문자의 개체명이 이전 개체명 범주와 이어진다면 (I-개체명 범주), 개체명에 해당되지 않는 문자의 경우 O 태그가 부착된다.

대상 데이터

학습, 개발, 평가 항목은 문장 수를 나타낸다. 범주 대상은 O 태그를 제외한 개체명 대상 범주 수이다. 실험에 사용할 각 언어에 대한 문자 임베딩은 Leipzig Corpora Collection Download Page[18]에서 제공하는 뉴스 말뭉치와 실험실에서 자체적으로 모은 뉴스 데이터를 이용하여 gensim 패키지[19]를 이용하여 사전 학습(pre-train) 했다.
범주 대상은 O 태그를 제외한 개체명 대상 범주 수이다. 실험에 사용할 각 언어에 대한 문자 임베딩은 Leipzig Corpora Collection Download Page[18]에서 제공하는 뉴스 말뭉치와 실험실에서 자체적으로 모은 뉴스 데이터를 이용하여 gensim 패키지[19]를 이용하여 사전 학습(pre-train) 했다. 한국어 개체명 말뭉치의 경우 ETRI에서 배포한 개체명 말뭉치[20]의 범주를 수정했다.
일본어 말뭉치의 경우에는 일본 드라마 자막을 모아 직접 구축한 개체명 말뭉치를 사용했다. 중국어는 CoNLL 형식으로 제작되어 배포된 웨이보 개체명 말뭉치[21]를 사용하였고, 영어는 CoNLL2003 Named Entity Recognition 말뭉치[22]를 사용했다.

이론/모형

[12]는 단어 간의 의존정보 희석을 해결하기 위해 주의 집중 방식(attention mechanism)을 적용하여 성능 향상을 보였다. 본 논문에서는 음절 기반의 다국어 개체명 인식의 성능 향상을 위해 Google에서 제안한 Transformer 신경망 구조의 핵심인 Multi-Head Attention 방식[13]을 적용한다.
학습에 사용한 파라미터는 실험을 통해 결정했으며, 그 값은 표 3과 같다. 실험에 사용한 평가 방법은 재현율(Recall)과 정확률(Precision)의 조화 평균인 F₁을 사용한다.

성능/효과

5) Feed-Forward Neural Network를 입력 문자가 어떤 개체명 태그에 적합할 것인지 확률을 계산한다. 6) 개체명 태그 정보와 전이 확률을 CRFs에 입력하여 입력 문장에 대하여 가장 적합한 개체명 태그열을 얻는다.
대체로 한국어와 일본어가 속한 교착어, 영어가 속한 굴절어, 중국어가 속한 고립어 순으로 성능이 낮아지는 것을 확인할 수 있었다.
본 논문에서는 Multi-Head Attention 방법을 적용한 Bi-GRU/CRFs를 이용하여 문자 기반의 입력을 통한 한국어, 일본어, 중국어, 영어의 개체명 인식을 실험하고 그 결과를 살펴봤다. 실험 결과 제안한 모델은 F₁ 점수를 기준으로 한국어에서 84.84%, 일본어에서 89.56%의 우수한 성능을 보였다. 그러나 영어에서는 76.
제안하는 모델은 한국어 개체명 인식에서 재현율 80.35%, 정확률 83.47%의 성능을 보였다. 재현율과 정확률이 떨어진 원인은 개체명 덩어리(chunk) 단위 인식이 잘못된 영향이 큰 것으로 분석된다.

후속연구

향후 연구로는 제안 모델을 개선하여 각 언어마다 각각 학습하여 인식기를 생성하는 것이 아니라 하나의 인식기로 안정적인 성능의 다국어 개체명 인식이 가능하게끔 모델의 구조를 개선할 예정이다.

질의응답

핵심어	질문	논문에서 추출한 답변
	개체명(named entity)이란 무엇인가?	개체명(named entity)은 특정한 개체를 나타내는 정보로써 고유한 의미를 가지는 단어 또는 어구이다. 개체명 인식(named entity recognition)은 주어진 입력 문장에서 개체명에 해당하는 말덩이(chunk)를 찾고, 적합한 범주(label)를 부착하는 작업이다[1].
	개체명 인식이란 무엇인가?	개체명 인식은 문서에서 인명, 지명, 기관명 등의 고유한 의미를 나타내는 단위인 개체명을 추출하고, 추출된 개체명의 범주를 결정하는 작업이다. 최근 개체명 인식과 관련된 연구는 입력 데이터의 앞, 뒤를 고려하기 위한 Bi-RNNs와 출력 데이터 간의 전이 확률을 이용한 CRFs를 결합한 방식을 기반으로 다양한 변형의 심층학습 방법론이 제안되고 있다.
	Multi-Head Attention 방법 Multi-Head Attention 방법을 적용한 Bi-GRU/CRFs를 이용하여 문자 기반의 입력을 통한 한국어, 일본어, 중국어, 영어의 개체명 인식을 실험한 결과는 어떠한가?	본 논문에서는 Multi-Head Attention 방법을 적용한 Bi-GRU/CRFs를 이용하여 문자 기반의 입력을 통한 한국어, 일본어, 중국어, 영어의 개체명 인식을 실험하고 그 결과를 살펴봤다. 실험 결과 제안한 모델은 F1 점수를 기준으로 한국어에서 84.84%, 일본어에서 89.56%의 우수한 성능을 보였다. 그러나 영어에서는 76.36%로 평균에 조금 못 미치는 성능을 보였으며, 중국어에서는 21.05%로 매우 저조한 성능을 보였다. 이는 각 언어에 최적화된 모델의 파라미터를 찾지 못했기 때문이라고 생각된다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

Multi-Head Attention 방법을 적용한 문자 기반의 다국어 개체명 인식
Character-Aware Neural Networks with Multi-Head Attention Mechanism for Multilingual Named Entity Recognition 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

질의응답

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

Multi-Head Attention 방법을 적용한 문자 기반의 다국어 개체명 인식 Character-Aware Neural Networks with Multi-Head Attention Mechanism for Multilingual Named Entity Recognition 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

질의응답

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

Multi-Head Attention 방법을 적용한 문자 기반의 다국어 개체명 인식
Character-Aware Neural Networks with Multi-Head Attention Mechanism for Multilingual Named Entity Recognition 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper