$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

예제 기반 챗봇을 위한 기계 학습 기반의 발화 간 유사도 측정 방법
A Machine Learning based Method for Measuring Inter-utterance Similarity for Example-based Chatbot 원문보기

한국산학기술학회논문지 = Journal of the Korea Academia-Industrial cooperation Society, v.11 no.8, 2010년, pp.3021 - 3027  

양민철 (고려대학교 컴퓨터.전파통신공학과) ,  이연수 (고려대학교 컴퓨터.전파통신공학과) ,  임해창 (고려대학교 컴퓨터.통신공학부)

초록
AI-Helper 아이콘AI-Helper

예제 기반 챗봇은 사용자 발화와 가장 유사한 예제 발화를 대화 예제 데이터베이스로부터 검색하여 응답을 생성한다. 가장 유사한 발화를 찾는 것은 응답의 적절성과 직결되는 것임에도 불구하고, 유사 발화 검색을 위해 어떠한 자질을 사용할 것인지, 어떠한 방식이 좋은 지에 대한 기존 연구는 부족하였다. 본 연구에서는 검색의 정확도와 예제의 활용도를 높이기 위해 다양한 어휘적, 의미적 자질을 이용한 기계 학습 방법을 제안한다. 실험 결과 1) 대화 예제 데이터베이스의 활용도 2) 예제 발화의 매칭의 정확률 3) 답변의 질적인 측면에서 제안하는 방법은 기존의 방법에 비해 더 나은 성능을 보였다.

Abstract AI-Helper 아이콘AI-Helper

Example-based chatBot generates a response to user's utterance by searching the most similar utterance in a collection of dialogue examples. Though finding an appropriate example is very important as it is closely related to a response quality, few studies have reported regarding what features shoul...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

가설 설정

  • 예제 기반 챗봇은 더 유사한 발화를 찾을수록 더 적절한 응답이 될 것이라는 가정을 한다. 따라서 어떠한 기준으로 입력된 사용자 발화와 가장 유사한 예제 발화를 찾을 것인가는 매우 중요한 문제이다.
  • 정확률은 테스트 발화에 대해 9만개의 예제 데이터베이스에 유사한 발화가 있다고 가정하며 절대적인 수치보다는 각 방법을 비교하는데 의미가 있다. 유사도 점수는 전체 테스트 쿼리에 대해서 서로 다른 방법들이 얼마나 더 유사한 발화를 찾는가를 평가하기 위한 것으로서 이것 역시 절대적인 수치보다는 각 방법을 비교하는데 의미가 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
예제 기반 챗봇의 기초가 되는 가정은? 예제 기반 챗봇은 더 유사한 발화를 찾을수록 더 적절한 응답이 될 것이라는 가정을 한다. 따라서 어떠한 기준으로 입력된 사용자 발화와 가장 유사한 예제 발화를 찾을 것인가는 매우 중요한 문제이다.
예제 기반 챗봇에서 입력된 사용자 발화와 가장 유사한 예제 발화를 찾기 위해 고려해야 할 것은? 첫째, 대화 시스템에서 발화 간 유사성을 비교할 때는 화자의 의도를 고려해야 한다. 대화에서는 화자와 청자가 있다. 따라서 상대방에 대한 명령이나 요청, 질문, 칭찬, 비난 등 다양한 양태가 나타나고, 동일한 사건이라도 대화가 이루어 지는 시제에 따라 현재, 미래, 과거로 다르게 표현할 수 있다. 따라서 자연스러운 대화가 되기 위해서는 이러한 다양한 상황에 대해 다르게 답변을 해야 한다. 둘째, 예제 기반 대화 시스템에서 대화 예제의 양이 아무리 크더라도 정확히 일치하는 경우는 거의 없기 때문에 최대한 유사한 발화를 찾아 활용할 수 있는 전략이 필요하다. 특히 채팅 시스템의 경우 목적 지향적 시스템과 달리 정확한 응답이 아니더라도 대화를 중단하는 것 보다는 가능하면 이어가는 것이 중요하므로 유사 발화 검색에서도 이러한 점이 고려되어야 한다. 셋째, 발화 간 유사도를 측정하는 기준은 보유하고 있는 예제 데이터베이스의 특성이 반영되어야 한다. 만약 데이터 베이스의 크기가 매우 크고 유사한 발화들이 매우 많이 분포하고 있다면 단순화된 패턴 매칭만으로는 분별력이 없어지게 된다. 반대로 대화 집합의 크기는 매우 작은데 여러 가지 기준으로 완전(exact) 매칭만을 고집한다면 매칭된 발화가 거의 없어 대부분의 대화가 이어질 수 없을 것이다. 따라서 유사 발화를 검색하는 기준에는 사용자의 의도를 반영하는 다양한 의미적 자질과 어휘적 자질이 고려되어야 하고 또한 이 기준을 적용할 때는 유사한 예제가 많을 때는 분별력이 있도록 다양한 자질을 고려하되 예제가 적을 때에는 완전히 일치하지 않더라도 다양한 자질들의 중요도를 고려하여 유사도를 측정할 수 있어야 한다.
챗봇이란? 챗봇(chatBot)은 사람과 컴퓨터가 자연어 형태로 다양한 주제의 일상적인 대화를 주고받는 시스템이다. 개발 초기에는 정신병 환자의 치료에 쓰이거나 단순한 재미를 위해 사용되었지만 최근에는 정보 획득, FAQ 시스템 등 목적 지향 시스템과 통합되어 자연스러운 대화 인터페이스를 제공하는 요소 기술로 사용되고 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (9)

  1. Weizenbaum, J. "Eliza - a computer program for the study of natural language communication between man and machine", Communications of the ACM, Vol. 9, pp. 36-45, 1965. 

  2. Levin et al., "The ALICE System: A Workbench for Learning and Using Language", CALICO Journal Vol. 9, No. 1, pp. 27-56, 1991. 

  3. H. Murao, N. Kawaguchi, S. Matsubara, Y. Yamaguchi, and Y. Inagaki. "Example-based spoken dialogue system using WOZ system log", SIGdial Workshop on Discourse and Dialogue (SIGDIAL 2003), pp. 140-148, 2003. 

  4. C Lee et al. "Correlation-based Query Relaxation for Example-based Dialog Modeling", ASRU, pp. 474-478, 2009. 

  5. Andres Marzal and Enrique Vidal. "Computation of normalized edit distance and applications", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 15. pp. 926-932. 1993. 

  6. Jay J. Jiang and David W. Conrath. "Semantic similarity based on corpus statistics and lexical taxonomy", In Proceedings of International Conference on Research in Computational Linguistics, Taiwan. 1997. 

  7. 윤애선 외, "한국어 어휘의미망 KorLex 1.5의 구축", 한국정보과학회 논문지, 제36권, 제1호, pp. 92-108. 2009. 

  8. T. Joachims. "Training Linear SVMs in Linear Time", Proceedings of the ACM Conference on Knowledge Discovery and Data Mining (KDD). 2006. 

  9. B.A. Shawar, and E. Atwell. "Different Measurement metrics to evaluate a chatbot system" Academic and Industrial Research in Dialog Technologies Workshop Proceediings. Association for Computational Linguistics. pp. 89-96. 2007. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로