$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

한국어 화행 분류를 위한 최적의 자질 인식 및 조합의 비교 연구
A Comparative Study on Optimal Feature Identification and Combination for Korean Dialogue Act Classification 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.35 no.11, 2008년, pp.681 - 691  

김민정 (고려대학교 컴퓨터.전파통신공학과) ,  박재현 (고려대학교 컴퓨터.전파통신공학과) ,  김상범 (SK Telecom 검색사업팀) ,  임해창 (고려대학교 컴퓨터.통신공학부) ,  이도길 (고려대학교 민족문화연구원)

초록
AI-Helper 아이콘AI-Helper

본 논문은 통계 기반 한국어 화행분류를 위하여 필요한 각 자질이 분류 성능에 미치는 영향과 성능 향상에 기여하는 자질 조합을 비교 평가한다. 지지벡터기계 학습 방법을 이용하여 구현한 화행 분류시스템을 통해 실험한 결과, n-gram 자질 중 품사 바이그램은 유용하지 않으며 형태소-품사 쌍과 다른 자질들을 결합했을 때 성능이 향상됨을 알 수 있었다. 또한, 자질 선택 기법을 사용한 자질 비율에 따른 실험을 통해서 매우 적은 자질만으로도 화행 분류에 있어 어느 정도 안정된 성능을 낼 수 있었다. 아울러, 실험 결과의 분석을 통해 한국어에서 마지막 어절이 문장 전체의 화행분류에 중요한 역할을 하며, 한국어의 특징인 자유 어순이나 주어의 빈번한 생략 등이 화행 분류 실험의 성능에 영향을 미친다는 사실도 알 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we have evaluated and compared each feature and feature combinations necessary for statistical Korean dialogue act classification. We have implemented a Korean dialogue act classification system by using the Support Vector Machine method. The experimental results show that the POS big...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 생각한다. 따라서 향후 연구로써 n-gram 자질을 형태소 분석 쌍과 품사 바이그램뿐만이 아닌 다른 형태로 적용하는 방법과 제안하는 자질을 n-gram 자질과 중복되지 않고 적용시킬 수 있는 방법에 대해 연구하고자 한다.
  • 또한, 한국어의 특성이 화행 분류에 미치는 영향을 실험을 통해 확인할 수 있었다. 마지막 어절, 마지막 용언둥의 자질이 유용하다는 것을 통해 한국어의 화행 분류에서 마지막 서술부가 유용하다는 점을 알 수 있었으며, 형식 형태소 어휘 열 자질과 형식 형태소 어휘 집합 자질의 비교 실험을 통해 자유 어순을 고려한 자질 군집화가 가능함을 보였다.
  • 본 논문에서는 n-gram 유형 자질과 마지막 어절 및특정 형태소 어휘를 이용한 자질을 같이 사용할 경우서로의 단점을 보완해줄 수 있을 것이라는 가정 하에각 자질에 대한 비교 평가를 수행하고 최적의 자질 조합을 찾아본다.
  • 본 논문에서는 각 자질이 한국어의 화행 분류에 미치는 영향을 살펴보기 위해 다음과 같이 실험을 하였다. 우선, 각 자질을 개별적으로 사용하여 화행 분류를 하여보고 화행 분류에서 가장 널리 쓰이는 n-gram 자질을 기저 성능으로 하여 다른 자질들을 추가해보는 실험을 하였다.
  • 본 논문에서는 도메인에 비종속적인 한국어 대화 말뭉치[1 이를 이용하여 화행 분류 실험을 수행하였다. 이말뭉치는 외국어 회화의 한글 해석 부분을 사용한 것으로 번역을 거친 것이지만 구어체이기 때문에 자연스러운 문장으로 이루어져 있어 한국어의 특성을 반영한 자질을 사용하는데 문제가 없었다.
  • 방법을 사용하였다. 본 논문에서는 위 실험 결과를 기반으로 한 개 자질을 제외하였을 때 더 높은 성능을 보인 것이 있을 경우 해당 자질을 제외하고 다시 다른 자질을 한 개씩 제외하는 추가 실험을 통해 가장 좋은 발화 자질 조합을 찾아보았다. 품사 바이그램과 마지막 보조용언, 주어를 제외한 모든 발화 자질을 사용하였을 때 가장 좋은 성능을 보이며, 형식 형태소 집합을 사용하였을 때 86.
  • 본 논문에서는 위 자질들을 지지벡터기계와 결합하여 화행 분류의 성능을 실험해 보았다. 지지벡터기계의 학습을 위한 자질은 각각의 자질들의 가중치로 벡터를 구성하였다.
  • 본 논문에서는 한국어 화행 분류를 위해 다음 자질들을 비교한다. 이전의 마지막 어절 및 특정 형태소를 사용한 연구에서는 이 외에도 의문사 사용 여부와 문장부호를 자질로 사용하였다[1 이.
  • 본 논문은 지지벡터기계 학습기법을 이용하여 구현 한화행 분류 시스템을 통해 통계기반 한국어 대화의 화행 분류를 위한 n-gram 유형 자질과 마지막 어절 및 특정형태소 어휘를 사용한 자질을 비교 평가하고, 한국어 화행 분류에 가장 적합한 자질 조합을 선별하였다.
  • 제안하는 자질 중 마지막 서술부 자질의 경우 형태소의 위치 정보를 포함한 것이긴 하나 마지막 용언 등의 자질은 형태소-품사 쌍과 중복이 될 수 있다. 연구에서는 n-gram 자질을 기본으로 마지막 어절 및 특정 형태소를 이용한 자질을 추가하여 각 자질이 가지는 문제를 서로 보완해주는지 여부를 확인하고자 실험을 진행하였으므로 이 문제는 본 연구에서 다루지 않았다. 하지만 이러한 한계는 추후 연구에서 좀 더 정밀한 자질 선별작업을 통해 개선되어야 할 것으로 판단된다.
  • 없었다. 이에 본 논문에서는 이전 연구에서 사용한 다양한 화행 분류를 위한 자질들을 비교 평가하고 화행 분류에 적합한 자질 조합을 찾아본다.
본문요약 정보가 도움이 되었나요?

참고문헌 (22)

  1. J.A. Austin, "How to Do Things with words," Harvard University Press, 1962 

  2. Massaki Nagata and Tsuyoshi Morimoto, "First steps towards statistical modeling of dialogue to predict the speech act type of the next utterance," Speech Communication Vol. 15, issue 3-4, pp. 193-203, 2004 

  3. Maria Jose Castro et al., "Dialogue Act Classification in a Spoken Dialogue system," CAEPIA- TTIA 2003, LNAI 3040, pp. 260-270, 2004 

  4. 이성욱, 서정연, "결정트리를 이용한 한국어 화행결정", 제 11회 한글 및 한국어 정보처리 학술대회 논문집, pp. 377-381, Oct. 1999 

  5. Won Seug Choi, Jeong-Mi Cho, Jungyun Seo, "Analysis System of Speech Acts and Discourse Structures Using Maximum Entropy Model," in the Proc. of 37th Annual Meeting of the ACL, pp. 230-237, Maryland, U.S.A., Jun. 1999 

  6. 은종민, 이성욱, 서정연, "지지벡터기계(Support Vector Machines)를 이용한 한국어 화행분석", 정보처리학회논문지B, 제 12-B권 3호, pp. 365-368, 한국정보처리학회, Jun. 2005 

  7. 김세종, 이용훈, 이종혁, "이전 문장 자질과 다음 발화의 후보 화행을 이용한 한국어화행 분석", 제 19회 한글 및 한국어 정보처리 학술대회 발표 논문집, pp. 23-30, 2007 

  8. 김경선, "개선된 자질 추출 및 가중치 부여 방법을 이용한 한국어 화행 분류 시스템", 서강대학교, 박사학위논문, 2005 

  9. 이현정, 서정연, "일정관리 영역에서 신경망을 이용한 사용자 의도 파악", 한국인지과학회 춘계학술대회 논문집, pp. 87-90, Jun, 2006 

  10. 김민정, 한경수, 박재현, 송영인, 임해창, "도메인에 비종속적인 대화에서의 화행 분류", 제 18회 한글 및 한국어 정보처리 학술대회 발표 논문집, pp. 246-253, 2006 

  11. Massaki Nagata and Tsuyoshi Morimoto. "An experimental statistical dialogue model to predict the speech act type of the next utterance," In Proceedings of the International Symposium on Spoken Dialogues, pp. 83-86, 1993 

  12. Norbert Reithinger and Martin Klesen, "Dialogue act classification using language models," In Proceedings of EuroSpeech-97, pp. 2235-2238, 1997 

  13. Max Louwerse and Scott Crossley, "Dialog act classification using N-Gram algorithms," In Proceedings of the International Florida Artificial Intelligence Research Society, Menlo Park, California, pp. 758-763, 2006 

  14. Stolcke, A. et al., "Dialogue act modeling for automatic tagging and recognition of conversational speech," In Computational Linguistics 26(3), pp. 339-373, 2000 

  15. Webb, N., Hepple, M., Wilks, Y., 2005. Dialog act classification based on intra-utterance features. In Proceedings of the AAAI Workshop on Spoken Language Understanding 

  16. Kwok Cheung Lan et al., "Dialogue Act Recognition Using Maximum Entropy," In Journal of the American Society for Information Science and Technology, 59(6), pp. 859-874, 2008 

  17. Godfrey, J., Holliman, E., & McDaniel, J. SWITCHBOARD:Telephone speech corpus for research and development. In Proceedings of the IEEE International Conference on Acustics, Speech, and Signal Processing (ICASSP-92) Vol. 1, pp. 517-520, 1992 

  18. 21세기 세종계획 국어 기초자료 구축 분과 연구 보고서, 2003 

  19. 이상주, "자동 품사 부착을 위한 새로운 통계적 모형", 고려대학교, 박사학위논문, 1999 

  20. Jacob L. Mey. Pragmatics: an introduction. Blackwell Publishers, 2nd edition, 2001 

  21. T. Joachims, Making large-Scale SVM Learning Practical. Advances in Kernel Methods - Support Vector Learning, B. Scholkopf and C. Burges and A. Smola (ed.), MIT-Press, 1999 

  22. 전성희, "한국어의 생략 현상 연구", 고려대학교, 석사학위논문, 2000 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로