$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

단어 의미 정보를 활용하는 이용자 자연어 질의 유형의 효율적 분류
Efficient Classification of User's Natural Language Question Types using Word Semantic Information 원문보기

정보관리학회지 = Journal of the Korean society for information management, v.21 no.4 = no.54, 2004년, pp.251 - 263  

윤성희 (상명대학교 컴퓨터소프트웨어공학) ,  백선욱 (상명대학교 컴퓨터소프트웨어공학)

초록
AI-Helper 아이콘AI-Helper

질의응답 시스템에서의 질의 분석 과정은 이용자의 자연어 질의 문장에서 질의 의도를 파악하여 그 유형을 분류하고 정답 추출을 위한 정보를 구하는 것이다. 본 연구에서는 복잡한 분류 규칙 집합이나 대용량의 언어 지식 자원 대신 이용자 질의 문장에서 질의 초점 어휘를 추출하고 구문 구조적으로 관련된 단어들의 의미 정보에 기반하여 효율적으로 질의 유형을 분류하는 방법을 제안한다. 질의 초점 어휘가 생략된 경우의 처리와 동의어와 접미사 정보를 이용하여 질의 유형 분류 성능을 향상시킬 수 있는 방법도 제안한다.

Abstract AI-Helper 아이콘AI-Helper

For question-answering system, question analysis module finds the question points from user's natural language questions, classifies the question types, and extracts some useful information for answer. This paper proposes a question type classifying technique based on focus words extracted from ques...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 영어권의 언어들에 대한 대규모 언어 지식베이스 등의 풍부한 자원에 비해 상대적으로 부족한 한국어 언어 자원의 문제를 해결하기 위해 대량의 코퍼스(corpus) 를 이용하거나 복잡한 규칙을 작성하지 않고 단어의미 정보를 중심으로 질의 유형을 분류하는 방법을 제안한다. 이용자의 자연어 질의 문장에서 질의의 초점을 나타내는 단어를 추출하고 구조적으로 인접한 단어들의 의미 체계 정보 (semantic category)# 이용해서 질의 유형을 분류할 수 있음을 보이고자 한다.
  • 본 논문에서는 질의응답 시스템에서 이용자질의의 유형을 분류하기 위해 복잡한 분류 규칙이나 대용량의 언어 자원을 이용하지 않고 질의문에 나타나는 단어의 의미 정보를 이용하는 방법을 제안하고 있다. 이용자의 자연어 질의 문장에서 의문사(interrogatives) 와 같은 질의 초점 어휘들을 추출하고 구문 구조적으로 인접하여 나타나는 단어들의 의미 정보를 이용하여 세부적인 정답 유형을 결정할 수 있는 질의 유형 분류 방법이다.
  • 본 연구는 TREC에서 질의응답 시스템의 성능을 평가하기 위해 제시하는 이와 같은 척도들을 참조하여 한국어 자연어 질의 분석을 위해 질의 초점 어휘인 의문사의 종류와 그에 따른 질의 유형의 분류를 체계화하고자 하였다.
  • 질의 유형 분류 과정이 시스템에 의해 정확 하게 이루어진다면 질의응답 시스템의 정답 추출 성능을 크게 향상시킬 수 있다. 본 연구에서는 영어권의 언어들에 대한 대규모 언어 지식베이스 등의 풍부한 자원에 비해 상대적으로 부족한 언어 자원의 문제를 해결하기 위해 대량의 코퍼스를 이용하거나 복잡한 규칙을 작성 하지 않고 단어들의 의미 정보 체계를 이용하여 질의 유형을 분류하는 방법을 제안하였다 이용자의 질의 의도를 파악하기 위해서 질의 문장에서 질의 초점 어휘와 구문적으로 인접한 단어의 의미 정보를 기반으로 질의 유형과 정답 유형을 결정할 수 있는 방법이다. 질의에서 구조적으로 인접한 단어들의 의미 정보 체계를 이용하여 질의 유형을 하위 단계까지 분류하여 시스템에서 정답 후보 생성과 정답 추출을 위해 효과적으로 사용할 수 있다.
본문요약 정보가 도움이 되었나요?

참고문헌 (24)

  1. 김수민, 백대호, 김상범, 엄해창. 2000. 시소러스 범주정보를 이용한 질의응답 시스템. '한글 및 한국어 정보처리 학술대회' 

  2. 김영택. 2001. 자연언어처리. '생능출판사' 

  3. 김학수, 안영훈, 서정연. 2003. 하이브리드 방법의 사용자 질의 의도 분류. '한국정보과학회 논문지-소프트웨어 및 응용', 30 (1): 51-57 

  4. 김현돈, 조성배. 2000. 한메일넷 질의 자동응답을 위한 이단계 자기구성 지도. '정보과학회 춘계학술대회' 

  5. 박세영, 강현규. 1998. 한글공학: 정보검색. '한국정보처리학회지', 특집, 5(5) 

  6. 박소연, 이준호 2002. 로그 분석을 통한 이용자의 웹 문서 검색 행태에 관한 연구. '정보관리학회지', 19(3): 111-122 

  7. 신승은, 이대연, 서영훈. 2004. 구문관계 정보를 이용한 한국어 질의응답 시스템, '한국콘텐츠학회 논문집', 4(2) 

  8. 양수정, 서영훈. 2003. 질의문의 구문정보를 이용한 키워드 추출. '한국콘텐츠학회 추계 종합 학술대회', 1(2) 

  9. 윤성희, 장혜진. 2004. 자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색. '정보관리학회지', 21(2): 235-248 

  10. 원정임, 윤지희, 이건배. 1997. 유사객체 검색에 의한 협력 질의 응답. '한국정보처리학회 추계 학술대회' 

  11. 이경순, 김재호, 최기선. 2000. KorQuA: 질의응답에서 자료 유형을 고려한 대답 검색과 대답 해석. 한글 및 한국어 정보처리 학술대회 

  12. 이재홍, 최호섭, 옥철영. 2003. 개념어의 습득을 위한 지식기반 질의응답시스템. '제15회 한글 및 한국어 정보처리 학술대회' 

  13. 황이규, 김현진, 장명길. 2004. 질의응답 기술 개발. '정보처리학회지', 11(2): 48-56 

  14. AAAI Fall Symposium on Question Answering. 

  15. Baeza Yates Ricardo. and Reberio Neto Berthier. 1999. Modern Information Retrieval. Addison Wesley 

  16. Burger J. and Cardie C. 2001. Issues, Tracks and Program Structures to Roadmap Research in Question & Answering(Q&A). 

  17. Edward H, Hermjakov U, Lin CY, Ravichandran D. 2002. Using Knowldege to Facilitate Factoid Answer Pinpointing. Coling 2002 

  18. Ellen M. Voorhees. 1999. The TREC-8 Question Answering Track Report. 

  19. Ellen M. Voorhees. Tice D. 2000. Building a Question Answering Test Collecion. Proceedings of SIGIR 2000. 200-207 

  20. Ittycheriah A. Franz M. etc. 2000. IBM's Statistical Question Answering System. TREC-9. 229-234 

  21. Jimmy L. 2002. The Web as Resource for Question Answering. LREC 2002 

  22. Jimmy L. and Boris Katz. 2003. Question Answering Techniques for the World Wide Web. 10th Conference of the European Chapter of the Association for Computational Linguistics (EACL-2003) 

  23. Lee G. Lee S. etc. 2001. Site/Q: Engineering high performance QA system using Lexico-semantic pattern matching and shallow NLP. TREC-10. 437-446 

  24. Moldovan D. Adrian N. 2002. Lexical Chain for Question Answering. Coting 2002. TREC(Text Retrieval Conference). 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로