[논문]멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석

박천음; 황현선; 이창기; 김현기

멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석
Korean Dependency Parsing with Multi-layer Pointer Networks 원문보기

박천음 (강원대학교) , 황현선 (강원대학교) , 이창기 (강원대학교) , 김현기 (한국전자통신연구원)

딥 러닝 모델은 여러 히든 레이어로 구성되며, 히든 레이어의 깊이가 깊어질수록 레이어의 벡터는 높은 수준으로 추상화된다. 본 논문에서는 Encoder RNN의 레이어를 여러 층 쌓은 멀티 레이어 포인터 네트워크를 제안하고, 멀티 태스크 학습 기반인 멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석 모델을 제안한다. 멀티 태스크 학습 모델은 어절 간의 의존 관계와 의존 레이블 정보를 동시에 구하여 의존 구문 분석을 수행한다. 실험 결과, 본 논문에서 제안한 모델이 기존 한국어 의존 구문 분석 연구들 보다 좋은 UAS 92.16%, LAS 89.88%의 성능을 보였다.

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

본 논문에서 제안하는 멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석은 기존 포인터 네트워크를 이용한 의존 구문 분석 모델의 인코더 부분을 여러 층으로 쌓아 인코딩을 수행하여 인코딩 레벨에서 각 단어들 간의 관계표현을 더욱 추상화하여 학습 및 예측을 수행하는 확장된 방법이다.
본 논문에서 제안한 멀티 레이어 포인터 네트워크를 이용한 의존 구문 분석은 멀티 태스크 학습 방법을 이용하며, 디코더의 입력으로 주어진 임의의 어절(형태소 단위로 나눠 입력)에 대하여 의존 관계를 갖는 중심어의 위치를 학습하고, 이에 해당하는 레이블 정보도 함께 학습한다. 멀티 레이어 포인터 네트워크는 인코더를 여러 층 쌓아 일반 포인터 네트워크보다 더 높은 추상화를 시도하는 모델이다.
본 논문에서는 인코딩 단계에서 인코더(Encoder RNN)를 여러 층으로 쌓아 더 높은 수준의 추상화를 시도하고, 디코딩 단계에서 멀티 태스크 학습 기반 포인터 네트워크를 이용하여 각 어절의 중심어를 찾고 의존 구문 분석의 레이블(label) 정보를 출력하는 멀티 레이어 포인터 네트워크(Multi-layer Pointer Networks)를 이용한 한국어 의존 구문 분석을 제안한다.
인코더와 디코더, 어텐션 레이어의 활성함수는 모두 tanh를 사용하였고, 의존 관계 레이블 Z_output의 활성함수는 relu를 사용하였다. 임베딩 레이어에서 적용되는 단어 표현은 형태소 단위 100차원을 사용하였고, 히든 레이어의 차원 수와 드랍아웃은 [14]에서 가장 좋은 성능을 보인 차원 수 600과, 드랍아웃 0.
2로 설정하였으다. 학습은 모멘텀(momentum)을 이용하였고, 학습율(learning rate) 0.1을 시작으로 성능 개선이 없으면 3 에포크(epoch)마다 50%씩 감소시켰다.

대상 데이터

본 논문에서 제안한 멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석의 실험 데이터는 의존 구조로 변환된 세종 데이터셋[13]을 사용하였으며, 데이터셋은 총 59,659 문장이다. 학습에 사용한 문장은 전체 문장 중 90%인 53,842 문장이고, 나머지 10%인 5,817 문장을 평가에 사용하였다.
본 논문에서는 인코더로 bidirectional Gated Recurrent Unit(BiGRU)[14]을 사용하며, 각 히든 레이어의 BiGRU 수식은 아래와 같다.
[표 1]은 본 논문에서 제안한 멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석 성능을 기존의 연구들과 비교한 표이다. 사용한 데이터는 모두 세종 코퍼스로 같으며 자동 형태소 분석 결과를 사용하였다. 실험 결과, 본 논문에서 제안한 멀티 레이어 포인터 네트워크를 이용하여 의존 구문 분석을 수행하는 방법이 일반 포인터 네트워크를 사용한 박천음[14]과 Deep biaffine 모델을 사용한 나승훈[9] 연구에 비하여 전반적으로 높은 성능을 보였으며, 2-layer stack cancat 모델이 UAS 92.
본 논문에서 제안한 멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석의 실험 데이터는 의존 구조로 변환된 세종 데이터셋[13]을 사용하였으며, 데이터셋은 총 59,659 문장이다. 학습에 사용한 문장은 전체 문장 중 90%인 53,842 문장이고, 나머지 10%인 5,817 문장을 평가에 사용하였다. 입력 형태소에 대한 단어표현은 10만 단어에 대한 2년치 뉴스기사를 Neural Network Language Model (NNLM)으로 학습한 것을 사용하였다.

이론/모형

전이 기반 의존 구문 분석은 입력(버퍼)과 스택으로부터 구문 분석 상태 표현을 얻고, 신경망을 이용하여 다음 전이 액션을 결정하는 방법이다[2-4]. 그래프 기반 방법은 입력 단어들에 대한 의존 관계의 점수(score)를 딥 러닝 모델로 계산하여 의존 구문 분석을 수행한다[5-9].
본 논문에서는 한국어 의존 구문 분석을 수행하기 위하여 인코딩 단계에서 더욱 높은 추상화를 시도하기 위한 멀티 레이어 포인터 네트워크 모델을 이용하였다. 실험 결과, 본 논문에서 제안한 방법이 2-layer stack과 concat 얼라인먼트 스코어 방법, 단어 표현 100차원, 히든 레이어 600 차원, 드랍아웃 0.
입력 형태소에 대한 단어표현은 10만 단어에 대한 2년치 뉴스기사를 Neural Network Language Model (NNLM)으로 학습한 것을 사용하였다. 의존 구문 분석 결과에 대한 평가 척도는 Unlabeled Attachment Score (UAS), Labeled Attachment Score(LAS)를 사용하였다.
학습에 사용한 문장은 전체 문장 중 90%인 53,842 문장이고, 나머지 10%인 5,817 문장을 평가에 사용하였다. 입력 형태소에 대한 단어표현은 10만 단어에 대한 2년치 뉴스기사를 Neural Network Language Model (NNLM)으로 학습한 것을 사용하였다. 의존 구문 분석 결과에 대한 평가 척도는 Unlabeled Attachment Score (UAS), Labeled Attachment Score(LAS)를 사용하였다.

성능/효과

사용한 데이터는 모두 세종 코퍼스로 같으며 자동 형태소 분석 결과를 사용하였다. 실험 결과, 본 논문에서 제안한 멀티 레이어 포인터 네트워크를 이용하여 의존 구문 분석을 수행하는 방법이 일반 포인터 네트워크를 사용한 박천음[14]과 Deep biaffine 모델을 사용한 나승훈[9] 연구에 비하여 전반적으로 높은 성능을 보였으며, 2-layer stack cancat 모델이 UAS 92.16%, LAS 89.88%로 박천음[14] 연구에 비하여 UAS 0.37%, LAS 0.4%, 나승훈[9] 연구에 비하여 UAS 0.38%, LAS 0.12%의 성능 향상을 보였다. 그러나 3-layer stack을 하였을 때 오히려 성능이 떨어지는 경향을 보였다.
본 논문에서는 한국어 의존 구문 분석을 수행하기 위하여 인코딩 단계에서 더욱 높은 추상화를 시도하기 위한 멀티 레이어 포인터 네트워크 모델을 이용하였다. 실험 결과, 본 논문에서 제안한 방법이 2-layer stack과 concat 얼라인먼트 스코어 방법, 단어 표현 100차원, 히든 레이어 600 차원, 드랍아웃 0.2와 같은 하이퍼 파라미터일 때UAS 92.16%, LAS 89.88%로 한국어 의존 구문 분석에 관한 선행연구들 보다 더욱 높은 성능을 보였다.

후속연구

향후 연구로는 의존 구문 분석을 수행하는 포인터 네트워크에 음절과 어절 표현을 추가로 적용하여 인코더에서의 표현력을 더욱 높인 네트워크 구조를 모델링 할 예정이다.

핵심어

질문

논문에서 추출한 답변

포인터 네트워크는 어떤 메커니즘을 기반으로 하는가?

포인터 네트워크는 RNN encoder-decoder에서 확장된 모델로서 어텐션 메커니즘을 기반으로 한다. 인코더는 RNN을 이용하여 입력 열에 대한 hidden state를 인코딩하여 인코딩 벡터로 만든다.

인코더의 구성 중 히든 레이어는 어떤 방식으로 인코딩 작업을 수행하는가?

인코더의 입력열 X는 임베딩 레이어에서 단어 표현(word embedding)이 적용되어 히든 레이어로 보내진다. 첫 번째 히든 레이어에서 BiGRU를 수행하여 인코딩 벡터 h1을 만들고, 그 다음 두 번째 히든 레이어에서 앞서 생성한 h1을 입력으로 인코딩을 수행한다. 두번째 히든 레이어의 인코딩 결과 h2는 세 번째 히든 레이어의 입력으로 주어 인코딩을 수행하여 h3를 만들며, 각 레이어마다 드랍아웃(dropout)을 적용하여 과적합(over fitting)을 방지한다.

의존 구문 분석이란 무엇인가?

구문 분석은 문장성분 사이의 관계를 분석하고 문장의 구조적, 의미적 중의성을 해결하는 자연어처리 문제이며, 의존 구문 분석(Dependency parsing)과 구구조 구문 분석(Phrase structure parsing) 등이 있다. 의존 구문 분석은 문장구조를 중심어(head)와 수식어(modifier)로 구성된 의존 관계로 표현하는 방법이며[1], 어순이 자유롭고 문장성분의 생략이 빈번한 한국어와 같은 언어에서 주로 연구되었다. 최근 딥 러닝 기반 의존 구문 분석은 RNN(Recurrent neural network)를 이용한 전이 기반 방법[2-4]과 그래프 기반 방법[5-9]이 활발하게 연구되고 있다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석
Korean Dependency Parsing with Multi-layer Pointer Networks 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

질의응답

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석 Korean Dependency Parsing with Multi-layer Pointer Networks 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

AI 본문요약 엑셀 다운로드 AI-Helper

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

질의응답

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

멀티 레이어 포인터 네트워크를 이용한 한국어 의존 구문 분석
Korean Dependency Parsing with Multi-layer Pointer Networks 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper