[논문]신뢰도 자질을 이용한 지식검색 문서의 품질 평가

이정태; 송영인; 임해창

문제 정의

본 논문에서 다루고 있는 문서의 품질 평가에 관한 연구는 학생들이 작성한 논술을 컴퓨터를 이용하여 자동으로 채점하는 논술 자동채점(Automated Essay Grading)에 관한 연구와 관련이 있다. 논술 자동채점 프로그램의 가장 대표적인 예로 Program Essay Grade(PEG)[2]를 들 수 있다.
본 논문에서는 기존 연구와 다르게 지식검색 문서의 품질을 내용의 신뢰도 측면에서 평가하는 방법을 제안한다. 이 방법은 높은 품질의 답변은 그 답변을 읽게 되는 사용자로 하여금 충분히 신뢰할 수 있을 정도로 최대한 성실하고 자세하게 작성되었고, 이에 비해 낮은 품질의 답변은 사용자가 신뢰할 수 없게끔 내용 면에서 불성실하고 불충분하게 작성되었을 것이라는 가정을 기반으로 한다.
본 논문에서는 사용자의 참여에 의해 작성된 지식검색 문서의 품질을 평가하기 위한 자질로서 신뢰도 자질을 제안하였다. 또한 네이버 지식검색 서비스에서 수집한 실제 문서들을 대상으로 하여 확률 기반의 문서 품질 평가 모델에 제안한 자질을 적용하였고, 실험 결과를 통해 신뢰도 자질이 지식검색 문서의 품질 평가에 있어 유용함을 입증하였다.
본 논문에서는 지식검색 문서의 품질 평가를 위해 신뢰도 자질이라고 정의한 새로운 자질을 제안한다.
본 연구에서는 문서 내용의 신뢰도를 측정하기 위한 새로운 자질을 제안한다. 또한 제안하는 신뢰도 자질의 유용성을 입증하기 위해 기존 비텍스트 정보를 다룬 연구[1]에서 진행한 방법과 동일하게 확률 기반의 문서 품질 평가 모델에 제안하는 자질을 적용하고 네이버 지식 검색 서비스에 실제로 존재하는 답변 문서를 대상으로 성능을 측정한다.
본 연구에서는 비텍스트 정보를 다룬 연구[1]에서 사용한 것과 동일한 분류 기반의 확률적 문서 품질 평가 모델을 구현하고, 이에 신뢰도 자질을 적용하여 자질의 유용성을 보이고자 한다. 이 모델은 최대 엔트로피 (maximum entropy) 모델[9]에 기반을 둔다.
주어진 답변을 문서 x라고 하고 이 x라는 문서에 매길 수 있는 품질 등급을 y = {good,medium,bad}라고 하자. 본 품질 평가 모델의 목적은 조건부 확률 p(y = good|x) 즉, 주어진 문서가 높은 품질의 문서일 확률을 구하는 것이다. 최대 엔트로피 모델을 이용하면 p(y|x)는 최대 엔트로피 모델을 이용하여 다음과 같이 계산될 수 있다.

가설 설정

• 답변의 길이 : 답변이 무조건 길다고 하여 성실하다는 보장은 없지만, 본 연구에서는 주어진 답변의 길이가 길수록 질문에 대하여 성실하고 최대한 자세하게 기술한 답변이라고 가정한다.²
• 개인의견 단어의 출현 비율 : 개인적 의견이 강한 문장에서 주로 나타나는 단어가 주어진 답변에서 차지하는 비율을 의미한다. 개인의견 단어가 빈번하게 사용될수록 문서가 객관적인 사실보다 주관적인 의견의 표현을 주로 담고 있을 가능성이 있기 때문에 신뢰도를 저하시킨다는 가정에 의해 자질로 선정되었다.
• 광고성 단어의 출현 비율 : 광고 메일이나 문자메시지 등에 주로 쓰이는 단어가 주어진 답변에서 차지하는 비율을 의미한다. 광고성 어휘가 빈번하게 사용되면 질문에 관련된 답변이라 할지라도 불성실한 답변 또는 질문에 적합하지 않은 답변일 가능성이 크기에 신뢰도를 저하시킨다고 가정한다.
• 가치판단어의 출현 비율 : 특정 객체에 대한 가치를 판단하기 위해 사용되는 가치판단어가 주어진 답변에서 차지하는 비율을 말한다. 성실하게 자신의 의견을 강조하거나, 어떤 주제에 대한 내용을 평가하고 근거를 제시하기 위해 자주 사용될 것이고, 따라서 신뢰도를 향상시킬 것이라는 가정 하에 자질로 사용하였다. 이모티콘의 출현 비율 : 주로 감정을 나타내는 이모티콘이 주어진 답변에서 차지하는 비율을 의미한다.
본 논문에서는 기존 연구와 다르게 지식검색 문서의 품질을 내용의 신뢰도 측면에서 평가하는 방법을 제안한다. 이 방법은 높은 품질의 답변은 그 답변을 읽게 되는 사용자로 하여금 충분히 신뢰할 수 있을 정도로 최대한 성실하고 자세하게 작성되었고, 이에 비해 낮은 품질의 답변은 사용자가 신뢰할 수 없게끔 내용 면에서 불성실하고 불충분하게 작성되었을 것이라는 가정을 기반으로 한다.
이모티콘의 출현 비율 : 주로 감정을 나타내는 이모티콘이 주어진 답변에서 차지하는 비율을 의미한다. 이모티콘이 빈번하게 나타난 답변일수록 가독성을 저하시키고, 이어 답변의 신뢰도를 저하시킬 것이라는 가정 하에 사용되었다.
• 추정어의 출현 비율 : 추정의 느낌이 강한 문장에서 주로 사용되는 어휘가 주어진 답변에서 차지하는 비율을 의미한다. 추정어가 많이 사용되었을 경우 뚜렷한 확신 없이 글을 작성하였을 가능성이 있다고 이는 곧 신뢰도를 저하시킨다는 가정 하에 자질로 사용되었다.

제안 방법

국내 관련 연구 중에서는 지식검색 문서의 평가 기준을 제시한 연구[7]를 들 수 있다. 구체적으로 이 연구에서는 지식검색 문서를 구성하는 질문과 답변의 적합도 평가 기준과 답변의 신뢰도 평가 기준을 제시하고, 또한 이러한 평가 기준에 근거하여 지식검색 문서의 실제 평가를 수행하였다.
구체적인 답변의 신뢰도 평가 기준은 와 같으며, 이 기준의 평가 항목 중 하나 이상을 만족시키면 기준에 부합되는 것으로 평가하였다.
사전에 기록될 단어를 뽑을 때에는 두 명의 동의하에서만 뽑았다. 그리고 이모티콘의 경우, 광고성 문자메시지에 주로 출연하는 어구 위주로 사전을 구축하였다. 각 어휘사전 기반 자질의 예는 <표 1>에 나타나 있다.
본 연구에서는 문서 내용의 신뢰도를 측정하기 위한 새로운 자질을 제안한다. 또한 제안하는 신뢰도 자질의 유용성을 입증하기 위해 기존 비텍스트 정보를 다룬 연구[1]에서 진행한 방법과 동일하게 확률 기반의 문서 품질 평가 모델에 제안하는 자질을 적용하고 네이버 지식 검색 서비스에 실제로 존재하는 답변 문서를 대상으로 성능을 측정한다.
본 연구에서는 품질 평가 모델이 출력하는 조건부 확률 즉, 답변이 좋은(신뢰도가 높은) 문서일 확률로 순위가 매겨진 답변 목록을 대상으로 일반화된 재현율과 정확률(generalized recall and precision)[14]로 모델의 성능을 측정한다. 일반화된 재현율과 정확률은 다등급(multi-grade) 문서에 대해 랭킹 성능을 평가하기 위한 정보검색 시스템 평가 척도로, 높은 등급의 문서가 상대적으로 낮은 등급의 문서보다 상위에 출현할 경우 높은 점수를 부여하여 성능을 측정하는 방식이다.
그중 문서 품질을 고려하는 연구로는 리뷰의 품질을 기계학습으로 평가하여 낮은 품질의 리뷰를 판별 및 여과하고, 이를 요약 기법에 반영하는 방법을 제안한 연구[8]를 들 수 있다. 이 연구에서는 리뷰 문서의 품질을 평가하기 위해서 리뷰 내용에 사용된 단어의 총 개수, 문장의 평균 길이, 주관적 문장(subjective sentence)¹의 비율 등을 자질로 사용하였다.
지식검색 문서의 품질 평가를 위한 연구로는 서론에서 언급한 추천 수 또는 조회 수 등 서비스 제공자 측에서 수집하는 비텍스트 정보를 이용하여 지식검색 문서의 품질을 평가하는 방법을 제안한 연구[1]를 들 수 있다. 이방법의 경우 추천 수나 조회 수 등 지식검색 문서의 답변과 관련된 총 13가지의 비텍스트 정보를 활용하여 기계학습 기반의 확률적 품질 평가 분류기를 만들어 품질 지수를 측정하고, 이를 검색 모델에 반영하여 검색 성능을 향상시켰다. 이러한 비텍스트 정보는 품질 평가에 충분한 양을 수집하는데 있어 시간을 요한다는 점이 단점으로 작용할 수 있다.
• 웹사이트 주소 출현 여부 : 참조한 웹사이트의 주소가 답변 내에 출현했는지의 여부를 의미한다. 주소가 있을 경우 객관적으로 정보의 출처를 밝히는 답변일 가능성이 높고, 따라서 신뢰도가 향상될 것이라는 가정에 기반을 두어 사용하였다.

대상 데이터

본 연구에서 사용한 실험 데이터 집합은 지식검색 문서의 평가 기준을 제시한 기존 연구[7]에서 구축된 것으로서, 비텍스트 정보를 이용한 연구[1]에서 사용한 것과도 동일한 집합이다. 본 데이터 집합은 네이버 지식검색 서비스⁶에서 수집된 문서로 이루어져 있으며, 각 문서는 사용자가 올린 질문과 이에 대해 타사용자가 작성한 답변으로 이루어져 있다.
실험을 위해 889개의 답변을 학습 집합으로, 1700개의 답변을 테스트 집합으로 사용하였다. 학습 집합과 테스트 집합의 구성은 <표 5>에 나타나 있다.

성능/효과

본 논문에서는 사용자의 참여에 의해 작성된 지식검색 문서의 품질을 평가하기 위한 자질로서 신뢰도 자질을 제안하였다. 또한 네이버 지식검색 서비스에서 수집한 실제 문서들을 대상으로 하여 확률 기반의 문서 품질 평가 모델에 제안한 자질을 적용하였고, 실험 결과를 통해 신뢰도 자질이 지식검색 문서의 품질 평가에 있어 유용함을 입증하였다. 기존 비텍스트 자질의 성능을 신뢰도 자질이 크게 개선하지는 못하였지만, 작은 어휘사전에 기반을 두어 비교적 단순한 방법으로 신뢰도 자질을 추출하여 사용하였음을 감안할 때, 상당히 의미 있는 성능 향상으로 판단된다.
앞서 기존 연구를 살펴본 바와 같이, 가장 최근의 지식검색 문서 품질 평가 방법은 비텍스트 정보를 이용한 방법[1]이다. 본 실험 환경의 실험 데이터와 품질 평가 모델은 모두 [1]에서 구축된 것과 동일하기 때문에 비텍스트 자질과 제안하는 신뢰도 자질 간의 성능 비교가 가능하다. 신뢰도 자질과 비텍스트 자질 7 의 성능 비교 실험 결과는 <그림 1> 및 <표 6>과 같다.
,d_n}에서 검색된 문서 집합(본 연구에서는 전체 답변), 그리고 N은 검색된 문서 집합의 크기(본 연구에서는 전체 답변의 개수)이다. 본 연구에서 다루는 답변은 3점 척도로 신뢰도가 부여되었기 때문에 전통적인 재현율과 정확률보다는 일반화된 재현율과 정확률이 본 실험 환경에 더 적합한 평가 척도라 할 수 있다.
위 실험 결과에서 지식검색 문서 품질 평가에 있어서 본 논문에서 제안하는 신뢰도 자질이 비텍스트 자질에 비해 성능을 개선하였음을 알 수 있으나, 그 개선의 폭은 약 1% 정도에 그쳐 큰 의미를 부여하긴 어렵다. 하지만 본 실험에서 사용한 신뢰도 자질의 추출이 수작업으로 구축된 소량의 어휘사전에 전적으로 의존한다는 한계점을 감안해볼 때, 그 유용성이 이미 입증된 비텍스트 자질과 동등하거나 나은 성능을 보여주었다는 것은 신뢰도 자질의 유용성을 입증하는 것이라 볼 수 있다.
위 실험 결과에서 지식검색 문서 품질 평가에 있어서 본 논문에서 제안하는 신뢰도 자질이 비텍스트 자질에 비해 성능을 개선하였음을 알 수 있으나, 그 개선의 폭은 약 1% 정도에 그쳐 큰 의미를 부여하긴 어렵다. 하지만 본 실험에서 사용한 신뢰도 자질의 추출이 수작업으로 구축된 소량의 어휘사전에 전적으로 의존한다는 한계점을 감안해볼 때, 그 유용성이 이미 입증된 비텍스트 자질과 동등하거나 나은 성능을 보여주었다는 것은 신뢰도 자질의 유용성을 입증하는 것이라 볼 수 있다. 신뢰도 자질 추출을 위하여 더 정교한 방법을 사용한다면, 문서 품질 평가에서 보다 높은 성능 향상을 이룰 수 있을 것이라 생각된다.

후속연구

또한, 본 연구에서 제안한 신뢰도 자질은 지식 검색 분야 문서에 종속적인 특징에 기반을 둔 것이 아니기 때문에, 지식검색 서비스에서의 문서 품질 평가뿐만 아니라 블로그, 제품 리뷰 등 다른 종류의 사용자 제작 문서의 품질 평가에도 유용할 것이라고 생각한다. 향후 연구로써, 신뢰도 자질 및 비텍스트 자질에 기반한 품질 평가 모델의 결과를 실제 검색 모델에 반영하여 일반적인 사용자 제작 문서의 검색 성능을 효과적으로 향상시킬 방안에 대해 연구하고자 한다.
하지만 본 실험에서 사용한 신뢰도 자질의 추출이 수작업으로 구축된 소량의 어휘사전에 전적으로 의존한다는 한계점을 감안해볼 때, 그 유용성이 이미 입증된 비텍스트 자질과 동등하거나 나은 성능을 보여주었다는 것은 신뢰도 자질의 유용성을 입증하는 것이라 볼 수 있다. 신뢰도 자질 추출을 위하여 더 정교한 방법을 사용한다면, 문서 품질 평가에서 보다 높은 성능 향상을 이룰 수 있을 것이라 생각된다.
먼저 실험 데이터의 부족으로 실험 결과의 신뢰성이 다소 떨어진다는 점이다. 신뢰도 자질을 추출하기 위해 수작업에 의한 어휘사전에 의존한다는 점 또한 이 연구의 한계이다. 이는 실험 데이터의 크기가 늘어나거나 또는 새로운 도메인의 실험 데이터의 문서 품질 평가가 요구될 때 추가적인 어휘사전 구축 작업을 필요로 할 가능성이 있다.
이는 실험 데이터의 크기가 늘어나거나 또는 새로운 도메인의 실험 데이터의 문서 품질 평가가 요구될 때 추가적인 어휘사전 구축 작업을 필요로 할 가능성이 있다. 이러한 한계는 제안하는 방법의 가장 큰 단점으로 생각되며, 추후 연구에서 개선되어야 할 것으로 판단된다.
또한, 본 연구에서 제안한 신뢰도 자질은 지식 검색 분야 문서에 종속적인 특징에 기반을 둔 것이 아니기 때문에, 지식검색 서비스에서의 문서 품질 평가뿐만 아니라 블로그, 제품 리뷰 등 다른 종류의 사용자 제작 문서의 품질 평가에도 유용할 것이라고 생각한다. 향후 연구로써, 신뢰도 자질 및 비텍스트 자질에 기반한 품질 평가 모델의 결과를 실제 검색 모델에 반영하여 일반적인 사용자 제작 문서의 검색 성능을 효과적으로 향상시킬 방안에 대해 연구하고자 한다.

핵심어	질문	논문에서 추출한 답변
	지식검색 서비스란 무엇인가?	지식검색 서비스란 사용자가 자발적으로 참여하여 쌍방향으로 질문과 답변을 하는 커뮤니티 기반의 서비스이다. 일반 검색엔진으로 찾기 힘든 정보를 원할 때 이를 질문으로 작성하면 다른 불특정다수의 사용자들로부터 답변을 얻을 수 있다는 강점 때문에 실제로 오늘날 네이버, 야후, 엠파스 등 여러 포탈의 대표적인 서비스로 정착하였다.
	논술자동채점 프로그램의 대표적 예인 PEG는 품질 평가에 있어서 어떤 부분에 초점을 두는가?	논술 자동채점 프로그램의 가장 대표적인 예로 Program Essay Grade(PEG)[2]를 들 수 있다. PEG는 사람이 논술을 채점할 때와 같이, 주어진 논술이 얼마나 잘 작성되었는지에 초점을 맞춘다. 이를 기반으로, 컴퓨터가 쉽게 측정할 수 있는 자질을 사용한다.
	지식검색 서비스의 문서 품질에 관한 문제를 해결하는 것이 시급한 이유는 무엇인가?	일반 검색엔진으로 찾기 힘든 정보를 원할 때 이를 질문으로 작성하면 다른 불특정다수의 사용자들로부터 답변을 얻을 수 있다는 강점 때문에 실제로 오늘날 네이버, 야후, 엠파스 등 여러 포탈의 대표적인 서비스로 정착하였다. 그러나 수많은 사용자들이 참여하게 되면서 그 어느 사용자라도 웹 브라우저만 있으면 답변을 작성할 수 있기 때문에 지식검색 문서의 품질을 해결하는 것이 시급한 상황이다. 이를 해결하기 위하여 지식검색 문서의 품질 평가에 관한 연구가 이루어지고 있지만 아직 미흡한 편이다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

신뢰도 자질을 이용한 지식검색 문서의 품질 평가
Quality Prediction of Knowledge Search Documents Using Text-Confidence Features 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

성능/효과

후속연구

질의응답

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

신뢰도 자질을 이용한 지식검색 문서의 품질 평가 Quality Prediction of Knowledge Search Documents Using Text-Confidence Features 원문보기

초록 AI-Helper

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

성능/효과

후속연구

질의응답

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

신뢰도 자질을 이용한 지식검색 문서의 품질 평가
Quality Prediction of Knowledge Search Documents Using Text-Confidence Features 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper