[논문]이미지-텍스트 매칭을 위한 동적 어텐션 네트워크

김영동

이미지-텍스트 매칭을 위한 동적 어텐션 네트워크 원문보기

김영동 (중앙대학교 대학원 통계학과 통계학전공 국내석사)

초록 ▼
AI-Helper

Image-text matching은 이미지와 텍스트의 연결고리 역할을 하기 때문에 관심도가 증가하고 있다. 이러한 작업에는 cross-modal 검색(즉, 시각적 질의가 주어지면 해당되는 텍스트를 검색하거나, 반대로 언어적 질의가 주어지면 해당되는 이미지를 검색하는 작업)이 포함된다. 이 분야의 핵심은 이미지와 텍스트 사이의 유사성을 어떻게 학습하는지에 달려있다.
본 논문에서는 Image-text matching 작업에서 이미지 및 텍스트 사이의 동적 정보를 교대로 전달하는 intra-modal과 inter-modal 정보 흐름을 가진 Dynamic Attention Network(DMAN) 모델을 제안하고자 한다. 이 모델을 사용하면 이미지와 텍스트 사이에서 높은 수준의 문맥적 상호작용을 포착할 수 있기 때문에 image-text matching에서의 성능향상을 기대할 수 있다.
본 논문에서는 교차모달 검색을 통해 성능비교를 하기 위해 Flickr30K와 MS-COCO라는 두 가지 이미지, 텍스트 검색 데이터에 대해서 실험을 진행하였고, 그 결과 기존의 모델과 비교하여 성능 향상을 확인하였다.

Abstract ▼ AI-Helper

Image-text matching problem is a link between image and text, so it has attracted great interest in the past decades. Tasks in Image-text matching include cross-modal retrieval (, image search for given sentences with visual descriptions and the retrieval of sentences from image queries.). The key to this study depends on how we learn the similarity between images and texts.
In this paper, we propose a Dynamic Attention Network (DMAN) with Intra-modal and inter-modal information flow that alternately delivers dynamic information between images and texts in cross-modal task. DMAN can capture high level of contextual interaction between images and texts, so we expect to improve performance in cross-modal retrieval.
In this study, two data such as Flickr30K and MS-COCO were experimented to compare performance through cross-modal retrieval, and as a result, performance improvement was confirmed compared with other models.

주제어

학위논문 정보

저자	김영동
학위수여기관	중앙대학교 대학원
학위구분	국내석사
학과	통계학과 통계학전공
지도교수	임창원
발행연도	2021
총페이지	iv, 29장
키워드	딥 러닝 멀티모달검색 어텐션기법 Deep learning Multi-modal retrieval Attention algorithm
언어	kor
원문 URL	http://www.riss.kr/link?id=T15782414&outLink=K
정보원	한국교육학술정보원

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명(한글), 저자명(한글), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문) 관리번호, 논문명(한글), 논문명(영문), 저자명(한글), 저자명(영문), 학위수여기관, 학위연도, 학위구분, 학과, 총페이지, 키워드, 초록(한글), 초록(영문)
저장형식	Text(ASCII format) Excel format
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

이미지-텍스트 매칭을 위한 동적 어텐션 네트워크 원문보기

초록 ▼
AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

이미지-텍스트 매칭을 위한 동적 어텐션 네트워크 원문보기

초록 ▼ 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

학위논문 정보

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

초록 ▼
AI-Helper