$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 주제 분류를 활용한 국립국어원 질의응답 게시판 유사 질문 검색 시스템
Similar Question Search System for Q&A board of The National Institute of the Korean Language using Topic Classification 원문보기

한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회, 2014 Oct. 07, 2014년, pp.201 - 205  

문정민 (금오공과대학교 컴퓨터소프트웨어공학과) ,  송영호 (금오공과대학교 컴퓨터소프트웨어공학과) ,  진지환 (금오공과대학교 컴퓨터소프트웨어공학과) ,  이현섭 (금오공과대학교 컴퓨터소프트웨어공학과) ,  이현아 (금오공과대학교 컴퓨터소프트웨어공학과)

초록
AI-Helper 아이콘AI-Helper

국립국어원의 온라인 가나다 서비스는 한국어에 대한 다양한 질문과 정확한 답변을 제공한다. 만일 새롭게 등록되는 질문에 대해 유사한 질문을 자동으로 찾을 수 있다면, 질문자는 빠른 시간에 답변을 얻을 수 있고 서비스 관리자는 수동 답변 작성의 부담을 덜 수 있다. 본 논문에서는 국립국어원 질의응답게시판의 특성을 분석하여 질문의 주제를 6가지로 분류하고, 주제 분류 정보와 벡터 유사도, 수열 유사도를 결합하여 유사한 질문을 검색하는 시스템을 제안한다. 평가에서는 본 논문에서 제시한 주제 분류 정보를 활용한 결과 1위 정답 검색 정확률이 향상되는 결과를 얻었다. 최종 실험에서는 MRR이 0.62, 정답이 1위, 5위내에 검색될 확률은 각각 54.2%, 78.2%를 보였다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 예를 들어 국립국어원의 질의응답 게시판에는 띄어쓰기에 대한 질문이 자주 발생하는데, 사용자의 질문이 띄어쓰기에 대한 질문이라면 띄어쓰기에 대한 다양한 답변들이 질문자에게 큰 도움이 될 수 있다. 본 논문에서는 국립국어원 질의응답게시판의 질문들에 대한 분석을 통해 다섯 분류의 질문 주제를 설정하고 유사 질문 검색에서 주제 분류를 사용하고자 한다. 아래에서는 국립국어원 질의응답의 다섯 주제와 새로운 질문의 주제를 결정하는 방법을 소개하고, 얻어진 주제 분류와 벡터 유사도, 수열 유사도를 결합하여 유사 질문을 검색하는 방법을 설명한다.
  • 본 논문에서는 유사 질문 검색에서 널리 사용되는 벡터 유사도와 수열 유사도와 함께, 질문의 주제 분류를 활용할 것을 제안한다. 그림 1은 제안하는 시스템의 개요를 보인다.
  • 기존의 질의응답시스템에 대한 다양한 접근은 정제되지 않은 문서를 대상으로 하거나[1] 통계적인 기법에 지나치게 의존하여[2,3] 국립국어원 게시판과 같이 잘 정제된 문서에서의 정확한 답변 추천에 적합하지 않다. 본 논문에서는 잘 정제된 신뢰도 높은 답변 문서가 제공되는 국립국어원의 온라인 가나다 서비스의 특징을 고려한 답변 추천 시스템을 제안한다. 이 시스템에서는 기등록된 질문들을 분석하여 사용자의 질문에 적합한 답변을 추천함으로써 빠른 시간 내에 원하는 답변을 제공한다.
  • 본 시스템에서는 입력되는 질문을 여섯가지 주제로 분류하여 유사도 계산의 정확도를 높이고자 한다. 시스템에서는 주제 적합도를 계산하여, 유사 주제의 질문이 높은 점수를 가질 수 있게 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
온라인 가나다가 Q&A시스템에 비해 가지는 장점은 무엇인가? 온라인 가나다는 관리자가 직접 답변을 등록하는 형태이기 때문에, 집단 지성의 형태로 구성되는 사용자 중심 Q&A시스템의 답변의 정보보다 신뢰성이 높아, 유사 질문검색이 효과적으로 적용될 수 있는 분야이다.
온라인 가나다 서비스는 어떤 방식으로 운영되고 있는가? 이 서비스는 2000년 8월 경 시작하여, 현재까지 약 12만 개의 한국어 관련 지식정보 데이터를 사용자에게 제공한다. 서비스는 사용자가 게시판에 질문을 올리면 전문성을 가진 관리자가 답변을 등록하는 방식으로 운영되고 있어 한국어에 대한 정확한 정보를 보장한다. 이와 같이 방대한 전문 데이터에 대한 편리한 검색 시스템이 제공된다면, 사용자는 관리자의 답변 작성을 기다리지 않고 즉시 정보를 얻을 수 있고, 관리자는 유사한 질문들에 대해 동일한 답변을 반복 작성해야 하는 문제를 해결하여 시스템 효율을 높일 수 있다.
온라인 가나다 서비스란 무엇인가? 국립국어원의 온라인 가나다 서비스는 한국어 어문 규범, 어법, 표준국어대사전 내용 등에 대하여 문의하는 인터넷 서비스이다. 이 서비스는 2000년 8월 경 시작하여, 현재까지 약 12만 개의 한국어 관련 지식정보 데이터를 사용자에게 제공한다.
질의응답 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로