논문 상세정보

비디오의 오디오 정보 요약 기법에 관한 연구

Investigating the Efficient Method for Constructing Audio Surrogates of Digital Video Data


본 연구는 비디오의 오디오 정보를 추출하여 자동으로 요약하는 알고리즘을 설계하고, 제안된 알고리즘에 의해서 구성한 오디오 요약의 품질을 평가하여 효율적인 비디오 요약의 구현 방안을 제안하였다. 구체적인 연구 결과를 살펴보면 다음과 같다. 먼저, 제안 오디오 요약의 품질이 위치 기반 오디오 요약의 품질 보다 내재적 평가에서 더 우수하게 나타났다. 이용자 평가(외재적 평가)의 요약문 정확도에서는 제안 요약문이 위치 기반 요약문 보다 더 우수한 것으로 나타났지만, 항목 선택에서는 이 두 요약문간의 성능 차이는 없는 것으로 나타났다. 이외에 비디오 브라우징을 위한 오디오 요약에 대한 이용자 만족도를 조사하였다. 끝으로 이러한 조사 결과를 기초로 하여 제안된 오디오 요약 기법을 인터넷이나 디지털 도서관에 활용하는 방안들을 제시하였다.


The study proposed the algorithm for automatically summarizing the audio information from a video and then conducted an experiment for the evaluation of the audio extraction that was constructed based on the proposed algorithm. The research results showed that first, the recall and precision rates of the proposed method for audio summarization were higher than those of the mechanical method by which audio extraction was constructed based on the sentence location. Second, the proposed method outperformed the mechanical method in summary making tasks, although in the gist recognition task(multiple choice), there is no statistically difference between the proposed and mechanical methods. In addition, the study conducted the participants' satisfaction survey regarding the use of audio extraction for video browsing and also discussed the practical implications of the proposed method in Internet and digital library environments.

이 논문을 인용한 문헌 (3)

  1. Kim, Hyun-Hee 2011. "A Study on the Interactive Effect of Spoken Words and Imagery not Synchronized in Multimedia Surrogates for Video Gisting" 한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, 45(2): 97~118 
  2. Kim, Hyun-Hee 2012. "Investigating an Automatic Method in Summarizing a Video Speech Using User-Assigned Tags" 한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, 46(1): 163~181 
  3. Kim, Hyun-Hee 2013. "Comparing the Use of Semantic Relations between Tags Versus Latent Semantic Analysis for Speech Summarization" 한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, 47(3): 343~361 


