최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기
Open Domain Question Answering(ODQA)는 질의가 주어질때 1) 문서 집합 에서 질의에 연관된 Passage를 찾아서, 2) 검색된 Passage를 통해서 추론을 한다는 이 두가지 단계를 거쳐서 질의에 대한 정답을 구하는 작업이다. 각각 단계에서는 검색 모델과, 추론 모델이 사용되는데 직관적으로도 검색 모델 의 품질이 향상된다면 추론의 난이도는 낮아지기 때문에 검색 모델의 개선은 ODQA에서 중요한 한 축을 이룹니다.
이러한 중요성과 더불어 최근 거대 언어 모델(LLM)에서는 Reinforce- ment Learning From Human Feedback(RLHF)방식을 이용하여 Feedback을 추론하는 모델을 Reward 모델로 삼아 ...
저자 | 서민택 |
---|---|
학위수여기관 | 전북대학교 대학원 |
학위구분 | 국내석사 |
학과 | 전자.정보공학부(컴퓨터공학) |
지도교수 | 나승훈 |
발행연도 | 2024 |
총페이지 | 33 p. |
키워드 | 문서 검색 모델 오픈도메인 질의 응답 인간 피드백에 의 한 강화 학습 |
언어 | eng |
원문 URL | http://www.riss.kr/link?id=T16948135&outLink=K |
정보원 | 한국교육학술정보원 |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.