$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

한국어 대화 엔진에서의 문장 분류
Sentence Classification for Korean Dialog Engine 원문보기

한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회, 2018 Oct. 12, 2018년, pp.210 - 214  

최동현 (카카오) ,  박일남 (카카오) ,  임재수 (카카오) ,  백슬예 (카카오) ,  이미옥 (카카오) ,  신명철 (카카오) ,  김응균 (카카오) ,  신동렬 (성균관대학교)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 한국어 대화 엔진에서의 문장 분류 방법에 대해서 소개한다. 문장 분류시 말뭉치에서 관찰되지 않은 표현들을 포함한 입력 발화를 처리하기 위하여, 태깅되지 않은 뉴스 데이터로부터 일반적인 단어 의미 벡터들이 훈련 및 성능 평가되었고, 이를 문장 분류기에 적용하였다. 또한, 실 서비스에 적용 가능한 빠른 분류 속도를 유지함과 동시에 문제에 특화된 의미 벡터들을 학습하기 위하여, 기존에 사용되던 캐릭터 기반 의미 벡터 대신 도메인 특화 단어 의미 벡터의 사용이 제안되었다. 실험 결과, 자체 구축된 테스트 말뭉치에 대하여 본 논문에서 제안된 시스템은 문장 단위 정확률 96.88, 문장당 평균 실행 시간 12.68 msec을 기록하였다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • GloVe 의미 벡터는 문장 분류 네트워크 모델 훈련 시에는 같이 훈련되지 않고 고정된 값을 계속 유지하도록 설정되었다. 또한, 각 문제에 특화된 단어의 의미를 별도로 훈련하기 위하여 본 논문에서는 GloVe 의미 벡터와 별도의 도메인 특화 의미 벡터가 제안되었다. 도메인 특화 의미 벡터는 GloVe 의미 벡터로 표현할 수 없는, 해당 문제에 특화된 단어의 의미를 나타내기 위한 것으로, 네트워크 모델 훈련 시에 같이 훈련되도록 설정되었다.
  • 이 중, 도메인 분류기와 의도 분류기는 모두 주어진 문장을 여러 개의 클래스 중 하나로 분류하는 문제로 정의될 수 있다. 본 논문에서는, 카카오 미니 인공지능 스피커에 적용된 한국어 문장 분류 시스템에 관하여 소개 한다. 빠른 처리 속도를 위하여 Convolutional Neural Network (CNN) [1]을 이용하는 기계학습 기반 접근 방식을 사용하였으며, 훈련 말뭉치에 등장하지 않는 표현들을 처리하기 위해서 GloVe[2] 방식으로 한국어 뉴스 데이터를 이용하여 훈련된 한국어 단어 의미 벡터들이 적용되었다.
  • 본 논문에서는, 한국어 대화 엔진에서의 문장 분류를 위한 시스템에 관하여 서술하였다. 해당 시스템을 구축하기 위하여 한국어의 특성을 고려한 GloVe 단어 의미 벡터 훈련 방법이 제안되었고, 이를 평가하기 위한 단어 유사도 말뭉치가 구축되었다.
  • 본 절에서는 제안된 문장 분류 시스템의 성능에 관하여 기술한다. GloVe 단어 의미 벡터는 K-GloVe 방식으로 N2015-7 뉴스 데이터 셌을 이용해 훈련되었으며, 벡터의 크기는 300차원으로 설정되었다.
  • 본 절에서는 한국어 GloVe 의미 벡터 및 문장 분류기에 대한 실험 결과를 서술한다.

가설 설정

  • 즉, 주어진 단어 ݅i와 ݆j의 의미 벡터 wi와 wj는 검침 단어 ݇k의 검침용 의미 벡터 #와 어떤 함수 F에 대하여, ܲPij가 단어 ݅i와 ݆j의 동시 출현 확률일 때 # 의 관계가 성립된다고 가정한다.
본문요약 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로