크라우드소싱 기반 이미지 태깅 시스템 구축 연구
Development of an Image Tagging System Based on Crowdsourcing

한국비블리아학회지 = Journal of the Korean Biblia Society for Library and Information Science, v.29 no.3, 2018년, pp.297 - 320  

이혜영 (숙명여자대학교 문헌정보학과) ,  장윤금 (숙명여자대학교 문헌정보학과)

본 연구는 이미지에 대한 접근 및 검색을 향상시키고, 이미지에 대한 설명 제공 도구로서의 태그를 효과적으로 생성하기 위한 방안을 모색하는데 목적이 있다. 이를 위해 이미지 태그를 생성하는 두 가지 방법인 휴먼 태깅과 머신 태깅의 특징을 조사하고 휴먼 태그와 머신 태그의 속성을 비교 분석하였다. 머신 태그는 일반적 속성이 가장 높았으며, 특정적 속성과 시각적 요소는 일부 나타났고, 추상적 속성은 거의 나타나지 않았다. 휴먼 태그도 일반적 속성이 가장 높았으나 휴먼 태그 생성자가 명칭을 알 수 있는 객체 및 장면에 대해서는 특정적 속성의 비중이 높았으며, 감정과 정서, 추상적 개념의 주제뿐 아니라 사건, 장소, 시간, 관계 등이 다양한 태그로 표현되었다. 본 연구를 통해 생성된 태그 집합은 머신러닝 알고리즘을 개선하기 위한 트레이닝 데이터세트를 구성하는데 기초 자료로 활용될 수 있을 것이다.

This study aims to improve the access and retrieval of images and to find a way to effectively generate tags as a tool for providing explanation of images. To do this, this study investigated the features of human tagging and machine tagging, and compare and analyze them. Machine tags had the highes...


크라우드소싱(crowdsourcing)이란 무엇인가? 크라우드소싱(crowdsourcing)은 네트워크로 연결된 사람들이 공동 작업을 수행하는 형태로 문제를 해결하고 콘텐츠를 생산하는 개념의 모델이라 할 수 있다. 크라우드소싱 태그는 공동 주석(collaborative annotation)의 의미로 소셜 태그라고도 하며, 비디오, 이미지, 웹페이지와 같은 온라인 디지털 객체를 구성하고 색인할때 인터넷 사용자가 수행하는 결합하는 등 결과이다.
이미지 검색은 어떻게 구분할 수 있는가? 이미지는 텍스트에 비해 내용을 직관적으로 전달하는 형태로서 가치와 의미를 지니며, 그 의미는 이미지 자체뿐만 아니라 이용자의 정보요구, 분석 시간이나 장소, 문화적·사회적 특징 등에 따라 달라질 수 있다. 이미지 검색은 내용 기반 검색과 의미 기반 검색으로 구분할 수 있다. 내용 기반 검색(CBIR: Content-Based Image Retrieval)은 이미지에서 시각적으로 보이는 것, 즉, 이미지 자체에서 추출되는 이미지의 색상, 형태 및 질감 등을 분석하여 검색하는 방법이다.
본 연구에서 적용한 협업 태깅 모델은 어떠한 효과를 가져왔으며, 어떠한 방식을 통해 이미지 태깅 시스템을 구축하였는가? 본 연구에 적용되는 방식은 머신 태그를 생성하여 기초데이터를 구성하고, 휴먼 태그를 통해 태그 추천 및 추가정보를 보완하는 협업 태깅 모델이다. 사람과 기계의 공동 작업을 토대로 휴먼 태깅과 머신 태깅을 결합하는 상호보완적 접근을 통해 이미지 태그를 정교화하고 품질을 향상시키며, 이미지의 다층적 기술과 다면적 해석 정보를 축적해가는 크라우드소싱 기반 이미지 태깅 시스템 모델을 구성하였다([그림 2] 참조).
