[논문]대규모 언어모델 기반 멀티세션 대화시스템과 세분화된 대화 벤치마크에서의 성능 분석

나요한

대규모 언어모델 기반 멀티세션 대화시스템과 세분화된 대화 벤치마크에서의 성능 분석
Large language model based multi-session conversation system and analyzing its performance in fine-grained multi-session benchmark 원문보기

나요한 (한양대학교 대학원 컴퓨터·소프트웨어학과 국내석사)

초록 ▼
AI-Helper

최근 대규모 언어모델 기반의 대화시스템이 등장하며 이를 활용한 검색, 문서작성, 질의응답 등 일상생활에서의 이용 사례가 증가하고 있다. 이에 따라 대화시스템은 사용자에게 친숙한 존재로 다가가고 있다. 한편 대화시스템 연구는 지식 관련 답변 생성능력에 관심이 집중 되어있는 만큼 ChatGPT와 같은 대화시스템은 사용자 간의 시간의 간격을 가진 대화(멀티 세션 대화)를 고려하여 설계되어 있지 않다. 앞으로의 대화시스템은 사용자의 대화를 기억하고, 개인의 기호에 적합한 정보 및 답변을 제공하는 개인화 대화시스템을 통해 사용자와 관계를 형성하는 시스템에 대한 수요도 높아지고 있다. 본 연구에서는 멀티세션 대화에 중점을 두고 언어모델이 대화 기억에 기반한 답변을 생성하는 능력을 중점으로 살펴보고자 한다. 멀티세션 대화를 평가하는 4가지 지표인 Engagingness, Humanness, Memorability, Specificity에 적합한 벤치마크 데이터를 선정하고, 각 세부 지표 별로 정량적으로 평가할 수 있는 방법인 Fine-grained Multi-Session Benchmark(FMS-Bench)를 제안한다. 제안한 멀티세션 벤치마크를 기반으로 기존 대화시스템 및 대규모 언어모델들을 평가한다. 또한 멀티세션 대화 데이터셋을 명령어 포맷 형태로 언어모델에 학습하여 명령어 튜닝을 수행하며, 이를 기반으로 한 멀티세션 대화시스템 모델을 제안한다. 이를 통해 멀티세션 대화시스템 분야의 연구를 대규모 언어모델 벤치마크처럼 정량적으로 평가할 수 있는 기반을 마련하고자 한다.

Abstract ▼ AI-Helper

In this study, we aim to evaluate the multi-session conversation ability of a language model in long-term memory, focusing on long conversations that took place over several periods. We select a multi-session conversation benchmark dataset and present an evaluation method that can quantitatively evaluate it. Based on the proposed methodology, we propose an instruction tuning-based multi-session dialogue system model that learns the multi-session dialogue dataset in instruction format from a large language model. Through this, we aim to lay the foundation for quantitatively evaluating research in the field of multi-session conversation systems using large language models.

주제어

학위논문 정보

저자	나요한
학위수여기관	한양대학교 대학원
학위구분	국내석사
학과	컴퓨터·소프트웨어학과
지도교수	채동규
발행연도	2024
총페이지	ii, 40 p.
키워드	컴퓨터공학
언어	kor
원문 URL	http://www.riss.kr/link?id=T16929595&outLink=K
정보원	한국교육학술정보원

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명(한글), 저자명(한글), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문) 관리번호, 논문명(한글), 논문명(영문), 저자명(한글), 저자명(영문), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문)
저장형식	Text(ASCII format) Excel format
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

대규모 언어모델 기반 멀티세션 대화시스템과 세분화된 대화 벤치마크에서의 성능 분석
Large language model based multi-session conversation system and analyzing its performance in fine-grained multi-session benchmark 원문보기

초록 ▼
AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

대규모 언어모델 기반 멀티세션 대화시스템과 세분화된 대화 벤치마크에서의 성능 분석 Large language model based multi-session conversation system and analyzing its performance in fine-grained multi-session benchmark 원문보기

초록 ▼ 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

대규모 언어모델 기반 멀티세션 대화시스템과 세분화된 대화 벤치마크에서의 성능 분석
Large language model based multi-session conversation system and analyzing its performance in fine-grained multi-session benchmark 원문보기

초록 ▼
AI-Helper