$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

문자 기반 LSTM-CRF 한국어 개체명 인식을 위한 사전 자질 활용
Lexicon Feature Infused Character-Based LSTM CRFs for Korean Named Entity Recognition 원문보기

한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회, 2016 Oct. 07, 2016년, pp.99 - 101  

민진우 (전북대학교) ,  나승훈 (전북대학교)

초록
AI-Helper 아이콘AI-Helper

문자 기반 LSTM CRF는 개체명 인식에서 높은 인식을 보여주고 있는 LSTM-CRF 방식에서 미등록어 문제를 해결하기 위해 단어 단위의 임베딩 뿐만 아니라 단어를 구성하는 문자로부터 단어 임베딩을 합성해 내는 방식으로 기존의 LSTM CRF에서의 성능 향상을 가져왔다. 한편, 개체명 인식에서 어휘 사전은 성능향상을 위한 외부 리소스원으로 활용하고 있는데 다양한 사전 매칭 방법이 파생될 수 있음에도 이들 자질들에 대한 비교 연구가 이루어지지 않았다. 본 논문에서는 개체명 인식을 위해 다양한 사전 매칭 자질들을 정의하고 이들을 LSTM-CRF의 입력 자질로 활용했을 때의 성능 비교 결과를 제시한다. 실험 결과 사전 자질이 추가된 LSTM-CRF는 ETRI 개체명 말뭉치학습데이터에서 F1 measure 기준 최대 89.34%의 성능까지 달성할 수 있었다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 개체명 인식에서 최고의 성능을 보여주고 있는 문자 기반 LSTM-CRF에 사전 매칭의 정교화와 조합을 통하여 기존의 성능을 크게 개선시켰다. 본 논문에서 사용한 매칭방법과 조합을 영문 개체명 인식에도 적용할 예정이다.
  • 한편 개체명 인식에서의 성능 향상을 위해 사전 등 외부 리소스를 활용하는 방안들이 연구되었다[2,8]. 본 논문에서는 다수의 리소스로부터 개체명 사전을 구축하고 사전의 매칭 방법을 다양화하여 각 매칭법의 장단점을 구분하고 매칭법을 조합하여 한국어 개체명 인식에 활용하고자 하였다. 최적의 사전 매칭조합을 자질로 사용한 결과 ETRI 개체명 말뭉치의 학습데이터에서 F1 measure 기준 [4]에 제시된 86.
  • 본 논문에서는 한국어 개체명 인식에서 영문에서와 같이 사전 자질을 활용하여 개체명 인식의 성능을 높이고자 하였다. 기존 문자 LSTM-CNN 기반한 단어 표상 방식에 품사 정보, 띄어쓰기 정보에 사전 자질을 추가하여 확장 단어 표상을 구성하였다.
본문요약 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로