[논문]질의응답시스템 응답순위 개선을 위한 새로운 유사도 계산방법

김명관; 박영택

문제 정의

다음 실험은 질의 형태를 좀 더 세분화하여 질의형태세분화가 단락의 재순 위에 어떠한 영향을 주는지에 관한 것이다. 이를 위하여 우선 30, 000개의 FAQ 문서에서 50회 이상 발생하는 질의 형태를 가지고 분류한다.
즉, 정보 검색 시스템에서 사용되는 색인 가능한 기본적인 정보 이외에도 색인할 수 없는 다양한 구문 정보 혹은 의미 정보들을 사용하여 정답임을 판별해 내는 분석 작업을 수행한다. 본 논문에서는 새로운 질의-문서 유사도 계산을 사용하여 단락의 순위를 조정하여 질의응답 시스템의 성능을 향상하기 위한 방법을 제안하였다.
본 논문에서는 위치정보와 질의 형태 분류정보를 반영한 유사도 계산을 통해서 응답 단락들의 순위를 조정하여 정답이 포함된 단락이 상위에 위치하는 것을 목표로 한다. 이를 구현한 시스템의 구성을 아래 그림에서 보여주고 있다.
본 논문에서는 정보검색 결과 문서들의 순위(Ranking)을 위해서 새로운 유사도 계산을 제안한다. 즉 위치정보와 질의형태분류기를 반영한 유사도 계산이다.
본 논문에서는 질의응답 시스템의 성능을 개선하기 위한 방법들을 제안하였다. 대량의 문서 집합 속에서 사용자가 원하는 정보를 검색한다는 점에서 질의응답 시스템은 정보 검색 시스템과 유사한 특징이 있다.
몇몇 분야에서 뉴럴 네트워크나 의사결정트리 학습기보다 우수한 성능을 나타낸다. 이 절에서는 나이브 베이지안 분류기를 질의 형태 분류에형태분류에 어떻게 적용하였는지를 보여 주었다.
이에 본 논문에서는 질의응답 시스템의 성능향상과 계산의 양을 줄이기 위해 질의에 가까운 문단을 찾기 위한 새로운 질의-문단 유사도 계산 방법을 제안한다. 이 방법은 질의형태에 따른 대답의 유형을 분류해서 질의와 관련 있는 문단을 구해주는 나이브 베이지안 분류기와 문장의 위치정보에 따른 계산 방법을 포함한다.
Croft[8]는 질의어에 대해 상위에 위치된 문서들 안에 있는 단어들과 질의어에 같이 발생한 단어들을 찾아서 질의어를 확장하는 연구를 하였다. 이와 다르게 우리는 질의어 형식에 따라 질의어 형태 분류가 대답의 순위를 결정하는데 어떠한 영향을 주는지를 보여줄 것이다.

가설 설정

1) Red roses are a pretty ornament for a party.
다음은 이항분포를 따르는 사건을 가정하여 질의 당 304개의 답변에 대하여 정답이 25개 포함되어있을 때 상위 5개에 정답이 있을 확률을 구해보았다. 이항분포이므로 이 사건의 평균 확률은 0.

제안 방법

이 실험은 TREC 9에 실제로 참가하였던 결과물로서 492개의 질의에 대한 응답 문단을 가지고 있으며 내용은 질의 각각에 대하여 100개의 유사도가 높은 순으로 나열된 문단들로 이루어져 있다.(49, 200개) 이 결과물에 본 논문의 유사도 계산 방법을 적용하여 정답의 상위(5위) 문단 포함확률을 계산하였다.
Cardie[12] 는 통계기법과 언어적 지식을 결합하고 정교한 언어적 필터를 갖는 질의응답을 제안한다. TR질의응답 트랙TREC 9의 질의응답 시스템은부분의 질의응답시스템은 일반적인 표준 TF IDF의 변형을 사용하여 구현되었다. 문단은 휴리스틱이나 수작업으로 이루어진 정규표현(Regular Expression)을 사용하여 선택되었다.
그다음 검색된 문서들에 대하여 일정한 크기의 단락을 만든 후(보통 3문장) 링크파서와 개념그래프 표현을 통해 문장 내의 각 단어들에 대한 위치정보를 구한다. 그리고 나이브 베이지안 분류기를 사용하여 질의에 대한 관련을 확률값으로 구한다. 결과사용자의 질의에 대하여 유사도가 높은 순으로 응답 결과를 보여준다.
나이브 베이지안 분류기의 실제 분류(Classification) 성능을 알아보기 위하여 반대로 높은 확률 값을 갖는 분류의 질의형태와 원래 질문의 형태가 같은지를 비교하는 실험을 한다. 693개의 질문에 대하여 분류기의 성능을 측정하기 위하여 위와 같은 실험을 시행한다.
또한 개념 그래프를 사용하여 문장에서 문법적인 성분으로부터 위치정보를 추출하는 방법도 자동화된 링크파서를 사용한 자연어처리기법을 사용하였다, 기존의 방법들이 수작업을 통한 예상 답변들의 패턴을 구하여 접근하는 방법인데 비해서 본 논문에서는 자연어처리 및 기계학습 방법을 통한 자동화에 초점을 맞추었으며 그 의의를 갖는다.
다루었다. 또한 통계적 기법으로 만들어진 단어 쌍과 위의 구문분석기법으로 만들어진 단어 쌍의 색인 효과를 비교하는 것으로 이루어졌다. 결과 통계적 기법으로 만들어진 단어의 쌍이 구문분석 방법 보다 더 높은 정확도를 보여주었다.
거의 20여 년 전에 MIT의 Katz는 의미 관계 망을 사용하여 자연어 검색과 색인에 대한 연구를 하였다[6]. 문장의 구(Phrase) 색인의 기본적인 아이디어는 1987년 Fagan 이 구문적인 구(자연어 분석)와 비구문적인 구(통계적 기법으로 구성된) 두 가지를 가지고 검색하는 실험을 하였다. 예를 들어 "use of an automatic text analyzer in preparation of sdi profiles"란음과 같은 구 기술자(Descriptor)를 생성한다[7].
본 논문에서는 일반적인 질의응답시스템의 구성요소인 표 1의 내용 중에서 4번인 응답 순위화에 관심을 갖는다 응답 순위를 개선하기 위하여 문장에서의 위치정보 반영, 질의 형태 분류를 사용한 나이브 베이지안 분류기를 사용한다. 이 두 가지 방법을 사용한 새로운 질의-문단 유사도 계산 방법을 제안한다.
이를 기본으로 주어진 질의형태를 분류하여 원하는 대답을 찾기 위해 분류기를 작성한다. 분류기는 뉴스그룹의 30, 000여 FAQ 문서를 가지고 기계학습 분류의 대표적 방법인 나이브 베이지안을 사용하여 제작한다.
이것은 베이지안 분류기가 각 단어에 대하여 독립적인 확률을 갖는 것 때문으로 추정된다. 분류성능에 대한 실험을 통해서 단락의 단어들에 분류기 확률값을 때적용했을 때 질의에 형태를 맞추는지를 실험하였다. 결과로 자동학습을 통해 얻은 나이브 베이지안 분류기가 61.
사용한다. 이 두 가지 방법을 사용한 새로운 질의-문단 유사도 계산 방법을 제안한다. 제안한 유사도 계산 방법을 사용하여 세계적인 정보검색대회인 TREC의 질의-데이타 순위를 조정하는 실험을 한다.
2001년 MIT의 Katz와 Line 위의 문제점을 개선한 Sapere 시스템[4]을 제안한다. 이 시스템은 변형 생성문법과 X-bar 이론에 기반 한 것으로 3개의 쌍으로 이루어진 의미표현(Ternary expression)을 제안한다. 즉 Sapere에서는 다음과 같은 문장이 3단어 쌍으로 변환된다.
아래 표들은 형태분류의 결과이다. 이를 기본으로 주어진 질의형태를 분류하여 원하는 대답을 찾기 위해 분류기를 작성한다. 분류기는 뉴스그룹의 30, 000여 FAQ 문서를 가지고 기계학습 분류의 대표적 방법인 나이브 베이지안을 사용하여 제작한다.
이를 위하여 우선 30, 000개의 FAQ 문서에서 50회 이상 발생하는 질의 형태를 가지고 분류한다. 따라서 표 4와 같이 22개 질의 형태 세부 분류기를 사용하여 유사도 계산을 수행한 경우 5개 분류기를 사용한 경우보다 더 좋은 결과를 얻지 못했다.
뉴스그룹에서 발췌한 FAQ (Frequently Asked Questions) 30, 000여 개를 가지고 질의 형태에 따른 질의어 분류를 하였다. 이를 정보검색에 반영하기 위하여 나이브 베이지안을 사용하여 분류기를 작성하였다.
된다. 이를 해결하기 위해서 개념그래프를 사용하여 자연어 문장에서 각 단어들의 위치정보를 반영할 수 있는 표현을 사용한다.
이 두 가지 방법을 사용한 새로운 질의-문단 유사도 계산 방법을 제안한다. 제안한 유사도 계산 방법을 사용하여 세계적인 정보검색대회인 TREC의 질의-데이타 순위를 조정하는 실험을 한다.
그러나 일반적으로 정보 검색 시스템이 사용자의 질의와 관련된 문서들을 찾는 데 반해 질의응답 시스템은 질의에 대한 정확한 답을 찾아야 한다는 점에서 일반적인 정보검색 시스템보다 더욱 정밀한 검색 작업이 요구된다. 즉, 정보 검색 시스템에서 사용되는 색인 가능한 기본적인 정보 이외에도 색인할 수 없는 다양한 구문 정보 혹은 의미 정보들을 사용하여 정답임을 판별해 내는 분석 작업을 수행한다. 본 논문에서는 새로운 질의-문서 유사도 계산을 사용하여 단락의 순위를 조정하여 질의응답 시스템의 성능을 향상하기 위한 방법을 제안하였다.
예로, Alpha[9]는 SMART 정보검색시스템으로부터 검색된 문서들로부터 대답을 추출하는 시스템을 보여주었다. 질의어는 대답에 적당한 요소를 구성하는 질문형식으로 분류되었다. 문서는 요소를 인식하기 위해 태그 되었으며 주어진 질의어에 대해 바른 형식의 개체를 둘러싸고 있는 문장은 휴리스틱을 사용하여 순위가 정해졌다.
추가로 포항공대에서 개발한 질의응답시스템의 유사도 순위 단락들을 가지고 실험하였다. 이 실험은 TREC 9에 실제로 참가하였던 결과물로서 492개의 질의에 대한 응답 문단을 가지고 있으며 내용은 질의 각각에 대하여 100개의 유사도가 높은 순으로 나열된 문단들로 이루어져 있다.
위치정보의 반영이다. 카네기멜론대학의 링크파서와 개념그래프를 사용하여 문서의 자연어표현에 있는 주어-목적어, 수식어-명사 등의 관계를 추출하였다. 이렇게 함으로써 문장에 의미구조를 정보검색 결과에 반영할 수 있었다.

대상 데이터

본 논문에서는 실험을 위해서 TREC-9의 693개의 질의어를 가지고 실험한다. 대상데이타는 이 693개의 질의어에 대해 TREC에 참가한 28개의 팀이 제출한 정답 50바이트와 250바이트 크기의데이타이다. 각 질의당 평균 304개의 데이타이며 이중정답을 포함하는 데이타는 약 10%에 해당하는 25개 정도이다.
그러나, 미국의 NIST(National Institute of Standards and Technology) 의 후원으로 1992년에 처음으로 개최된 학술 대회 TREC(Text REtrieval Conference) 에서 1백만 건을 초과하는 문서들을 대상으로 대용량 테스트 컬렉션의 구축을 시작하였으며, 이후 매년 테스트 컬렉션에 포함되는 문서들의 수를 증가시키고 있다. 본 논문에서는 실험을 위해서 TREC-9의 693개의 질의어를 가지고 실험한다. 대상데이타는 이 693개의 질의어에 대해 TREC에 참가한 28개의 팀이 제출한 정답 50바이트와 250바이트 크기의데이타이다.
순위 단락들을 가지고 실험하였다. 이 실험은 TREC 9에 실제로 참가하였던 결과물로서 492개의 질의에 대한 응답 문단을 가지고 있으며 내용은 질의 각각에 대하여 100개의 유사도가 높은 순으로 나열된 문단들로 이루어져 있다.(49, 200개) 이 결과물에 본 논문의 유사도 계산 방법을 적용하여 정답의 상위(5위) 문단 포함확률을 계산하였다.
질의어의 형태는 다양하게 분석되고 있으며 본 논문에서는 정보검색경진대회 TREC-9의 질의응답 시스템 분야 질의 693개와 뉴스그룹의 자주 대답 되는 질문 문서 (FAQ) 30,000여 개를 가지고 질의 형태 분류를 실시한다. 아래 표들은 형태분류의 결과이다.

이론/모형

이에 대한 평가는 TREC에서 사용하는 평균상호순위 (MRR, Mean Reciprocal Rank, 이하 MRR로 표기)를사용한다. 이 값은 정답이 1위에 위치되었을 때 1, 2위에는 1/2, 3위에는 1/3 값을 취하며 5위 이후에 위치했을 때는 0을 값으로 취한다.
개념 그래프 변형규칙에 언급된 방식대로 S 와 0, J 등의 링크만을 고려하여 변형을 수행하게 된다. 이와 같이 위치정보를 포함시킨 다음에 질의-문서 유사도를 구하기 위하여 대표적인 Dice Coefficient 방법(1) 올 가지고 계산하게 된다.

성능/효과

결과 382개였으며 전체에 대해 55.1%의 정확도를 보여주었다.
또한 통계적 기법으로 만들어진 단어 쌍과 위의 구문분석기법으로 만들어진 단어 쌍의 색인 효과를 비교하는 것으로 이루어졌다. 결과 통계적 기법으로 만들어진 단어의 쌍이 구문분석 방법 보다 더 높은 정확도를 보여주었다. 그의 연구 결과 자연어처리 기법의 적용이 더 어려울 뿐 아니라 덜 효과적인 것으로 나타났다.
결과는 3개의 문장으로 이루어진 문단에 대한 새로운 유사도 방법에 순위 개선이 0.27에서 0.35로 나타났으며 250바이트로 정답 문단을 추출하여 상위 5위 안에 정답이 속하였는지를 측정한 결과는 기존 시스템 0.33에 비해 조금 낮은 0.3을 기록하였다. 이 결과는 기존의 시스템이 정규표현 등 여러 가지 기법을 사용하여 복잡한 과정으로 정답을 추출하는데 비하여 본 시스템은 유사도 계산 만을 사용하여 질의어 키워드 중심으로 250바이트를 추출하였기 때문이다.
분류성능에 대한 실험을 통해서 단락의 단어들에 분류기 확률값을 때적용했을 때 질의에 형태를 맞추는지를 실험하였다. 결과로 자동학습을 통해 얻은 나이브 베이지안 분류기가 61.3% 정도의 분류성능을 나타내었다. 또한 정답을 찾아낸 정확도가 질의 693개 중에서 382개로서 TREC-9에 참가한 상위 20개 팀의 50바이트 250바이트 제안 평균보다 높은 약 55.
693개의 질문에 대하여 분류기의 성능을 측정하기 위하여 위와 같은 실험을 시행한다. 결과질의어 693개 중에 5개의 질의 형태 분류로 되어있는 질의어 581개에 대하여 356개를 바르게 예상하였고 정확도는 61.3%를 기록한다.
결과 통계적 기법으로 만들어진 단어의 쌍이 구문분석 방법 보다 더 높은 정확도를 보여주었다. 그의 연구 결과 자연어처리 기법의 적용이 더 어려울 뿐 아니라 덜 효과적인 것으로 나타났다. 2001년 MIT의 Katz와 Line 위의 문제점을 개선한 Sapere 시스템[4]을 제안한다.
이를 693개의 질의어를 감안하면 질의당 평균 304개의 데이타가 제출된 것이며 이 중 정답을 포함한 데이타는 25개 정도로 볼 수 있다. 또한 TREC-9의 상위 20개 팀의 250바이트 제한에서 답을 발견한 평균은 377개 정도로 약 54%의 정확도를 보이고 50바이트에서는 245개로 정확도 35%를 나타낸다.
3% 정도의 분류성능을 나타내었다. 또한 정답을 찾아낸 정확도가 질의 693개 중에서 382개로서 TREC-9에 참가한 상위 20개 팀의 50바이트 250바이트 제안 평균보다 높은 약 55.1% 정도로 나타났다.
제안한 방법에 의해 TREC-9의 693개 질의어에 대한 참가한 28개 팀들이 제출한 21만여 개의 50바이트, 250 바이트 데이타에 대해 상호순위를 실험하였으며 평균 상호순위가 TREC-9에 참가한 팀의 MRR 값 중에서 4위와 5위 사이인 0.29를 기록하였다. 질의어를 세분화하여 22개의 형태로 분류하는 실험도 실시하였는데 질의어를 5개로 분류한 것에 비하여 별 차이가 없는 결과를 보였다.
29를 기록하였다. 질의어를 세분화하여 22개의 형태로 분류하는 실험도 실시하였는데 질의어를 5개로 분류한 것에 비하여 별 차이가 없는 결과를 보였다. 이것은 베이지안 분류기가 각 단어에 대하여 독립적인 확률을 갖는 것 때문으로 추정된다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

질의응답시스템 응답순위 개선을 위한 새로운 유사도 계산방법
A New Similarity Measure for Improving Ranking in QA Systems 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

이론/모형

성능/효과

참고문헌 (15)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

질의응답시스템 응답순위 개선을 위한 새로운 유사도 계산방법 A New Similarity Measure for Improving Ranking in QA Systems 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

이론/모형

성능/효과

참고문헌 (15)

이 논문을 인용한 문헌

저자의 다른 논문 :

박영택 (73)

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

질의응답시스템 응답순위 개선을 위한 새로운 유사도 계산방법
A New Similarity Measure for Improving Ranking in QA Systems 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper