$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

장면의 유사도 패턴 비교를 이용한 내용기반 동영상 분할 알고리즘
Content based Video Segmentation Algorithm using Comparison of Pattern Similarity 원문보기

멀티미디어학회논문지 = Journal of Korea Multimedia Society, v.14 no.10, 2011년, pp.1252 - 1261  

원인수 (인하대학교 전자공학과) ,  조주희 (인하대학교 전자공학과) ,  나상일 (인하대학교 전자공학과) ,  진주경 (인하대학교 전자공학과) ,  정재협 (인하대학교 전자공학과) ,  정동석 (인하대학교 IT공대)

초록
AI-Helper 아이콘AI-Helper

본 논문은 내용기반 동영상 분할을 위한 장면의 유사도 패턴 비교 방법을 제안한다. 동영상 장면 전환의 종류는 크게 급진적 전환과 디졸브(dissolve), 페이드인(fade-in), 페이드아웃(fade-out), 와이프 전환(wipe transition)을 포함하는 점진적 전환 형태로 나눌 수 있다. 제안하는 방법은 모든 종류의 장면 전환 검출 문제를 단지 발생 유무의 문제로 간단 정의하고, 장면 전환 종류는 별도로 구분하지 않는다. 장면 전환을 검출하기 위해서는 프레임간의 유사도를 정의해야 한다. 본 논문에서는 장면 내 유사도(within similarity)와 장면 간 유사도(between similarity)를 정의하며 두 유사도의 통계적 패턴 비교를 통하여 최종적으로 장면 전환을 검출하게 된다. 장면 내 유사도와 장면 간 유사도의 비율을 구하는 방법을 통해 플래시라이트나영상 내 물체 움직임에 대한 거짓 양성 검출을 별도의 후처리 과정 없이도 방지할 수 있음을 확인하였다. 프레임의 특징 값으로는 컬러 히스토그램과 프레임 내 평균 화소값을 이용하였다. TREC-2001, TREC-2002 동영상 셋을 포함한 실험 셋에서 성능을 평가한 결과 제안하는 알고리즘의 경우 총 91.84%의 재현율(recall)과 86.43%의 정확도(precision)의 성능을 보임을 확인할 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose the comparison method of pattern similarity for video segmentation algorithm. The shot boundary type is categorized as 2 types, abrupt change and gradual change. The representative examples of gradual change are dissolve, fade-in, fade-out or wipe transition. The proposed m...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 논문에서는 영상 프레임 시퀀스로부터 영상 프레임의 전체 평균 밝기 값을 이용하여 윈도우 내에서의 분산과 분산의 1차 미분 값을 이용 디졸브 검출 성능을 향상하고자 하였다.
  • 본 논문에서는 동영상의 장면 전환을 검출하기 위하여 장면 간 유사도와 장면 내 유사도를 정의하고 프레임 영상 간 비교 과정에서 생성된 패턴을 사용하여 장면 전환을 검출하는 방법을 제안하였다. 비교적 잡음에 강한 히스토그램 기반의 특징을 이용함과 동시에 영상의 공간적 정보를 이용하기 위한 부분 블록 내 화소 평균값을 이용하여 히스토그램이 갖는 한계를 보완하고자 하였다.
  • 본 논문에서는 장면과 장면간의 전환이 발생하는 구간을 검출하기 위하여 장면 내 유사도와 장면 간 유사도의 비율을 구하고 그 비율이 국부 최소값을 이루는 지점을 장면 전환 지점으로서 검출한다. 이 방법은 장면 내에서 플래시라이트나 물체의 움직임과 같은 일시적이면서 급격한 시각적 변동이 발생하더라도 장면 내 유사도와 장면 간 유사도의 비율을 비교하여 거짓 양성을 방지할 수 있는 효과를 얻는다.
  • 본 논문에서는 동영상의 장면 전환을 검출하기 위하여 장면 간 유사도와 장면 내 유사도를 정의하고 프레임 영상 간 비교 과정에서 생성된 패턴을 사용하여 장면 전환을 검출하는 방법을 제안하였다. 비교적 잡음에 강한 히스토그램 기반의 특징을 이용함과 동시에 영상의 공간적 정보를 이용하기 위한 부분 블록 내 화소 평균값을 이용하여 히스토그램이 갖는 한계를 보완하고자 하였다. 실제 실험 환경에서 높은 검출 성능을 보임을 확인할 수 있었다.
  • 제안하는 동영상 장면 전환 검출 알고리즘은 각 프레임 영상으로부터 특징 값을 추출하고 이를 이용하여 장면 간 유사도와 장면 내 유사도 패턴을 생성한다. 생성된 패턴을 비교하여 최종적으로 장면 전환을 검출해 내는 방법에 대해 서술한다.
  • 하지만 히스토그램 자체는 영상의 공간적 정보를 포함하지 않고 점진적 변화에 대해서 변별력을 보이지 못하는 특성을 보인다. 이를 보완하기 위해서 밝기 영상의 부분 블록 내 화소 평균값을 특징으로 함으로써 공간정보의 변화를 감지할 수 있도록 하였다. H, S, V 채널별로 히스토그램을 추출하였고, 연속하는 프레임 간의 유사도를 FSC 로 정의하고, 식 (1)과 같이 히스토그램 교차(histogram intersection) 방법을 사용하여 계산하였다.

가설 설정

  • (3) 장면 전환점을 기준으로 장면 간 유사도 SB 는 장면 내 유사도 SW 보다 작거나 같다.
  • 하지만 위와 같은 모델링은 장면 X 에서 Y 로의 전환이 선형적으로 발생함과 동시에 장면 X 와 Y 에서의 카메라 움직임이 없거나 아주 적다는 가정을 포함하고 있다. 이에 본 논문에서는 동일한 장면 내 프레임 간 유사도와 서로 다른 장면 간의 프레임 간 유사도의 관계를 다음과 같이 정의하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
동영상 장면 전환의 종류는 어떻게 구분할 수 있는가? 이 중에서도 장면 분할에 의한 동영상 관리 방법은 동영상의 내용을 기반으로 하는 색인(indexing), 브라우징(browsing) 및 검색(retrieval)을 위한 가장 기본적인 과정이다. 동영상 장면 전환의 종류는 크게 카메라 컷을 기준으로 한 급진적 변환(abrupt change)과 디졸브(dissolve), 페이드인(fade-in), 페이드아웃(fadeout) 와이프 전환(wipe transition) 등을 포함하는 점진적 변환(gradual change)로 구분할 수 있다. 동영상 분할을 위한 장면 전환 검출에 대한 대부분의 연구는 시간적으로 인접한 프레임 영상간의 정량적 유사도를 구하고 유사도 값의 국부 최소값을 구하는 방법을 이용한다.
디코딩 이후의 스트림을 이용하는 방법 중 히스토그램 차이에 기반을 두는 방법은 어떤 문제점이 있는가? 화소 값 기반 방법은 비교적 계산양이 적고 급진적 장면 전환에 대해 좋은 검출 성능을 보이지만 영상 프레임 내 물체의 움직임이나 카메라 움직임, 혹은 플래시라이트 등에 민감하기 때문에 높은 거짓 양성율(false positive rate)을 보이는 특성을 보인다[11]. 반면 히스토그램 기반의 방법은 위에서 열거한 방해요소에 대해 비교적 강인한 특성을 보이지만 계산 량이 많기 때문에 속도 면에서는 성능이 떨어진다는 특징이 있다. 디졸브와 같은 점진적 변환에서는 장면 전환 시간이 긴 경우 현재 프레임 영상에서 바로 인접한 이웃 프레임 만을 비교하는 것만으로는 장면 전환 검출에 한계를 나타낸다.
프레임 영상간의 유사도는 어떻게 나눌 수 있는가? 대부분의 장면 전환 알고리즘의 경우 동영상 프레임간의 특징을 비교하여 유사도를 구하게 된다. 프레임 영상간의 유사도는 압축된 스트림 자체에서 특징 정보를 이용하여 정의하는 방법과 디코딩 이후의 스트림으로부터 특징 정보를 이용하여 정의하는 방법으로 나눌 수 있다. 압축된 스트림에서는 DCT 계수[1,2], 매크로블록의 종류[3] 혹은 움직임 벡터[4]에 기반을 두는 방법 등이 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. B. L. Yeo and B. Liu, "Rapid Scene Analysis on Compressed Video," IEEE Trans. on Circuit and System for Video Technology, Vol.5, pp. 533-544, 1995. 

  2. H. J. Zhang, C. Y. Low, and S. W. Smoliar, "Video Parsing and Browsing using Compressed data," Multimedia Tools and Applications, Vol.1, pp. 89-111, 1995. 

  3. J. Cao and A. Cai, "A Robust Shot Transition Detection Method Based on Support Vector Machine in Compressed Domain," Journal of LSEVIER, Pattern Recognition Letter , Vol. 28, pp. 1534-1540, 2007. 

  4. C. W. Su, H. Y. M. Liao, H. R. Tyan, and L. H. Chen, "A Motion Tolerant Dissolve Detection Algorithm," IEEE Trans. on Multimedia, Vol.7, pp. 1106-1113, 2005. 

  5. H. J. Zhang, A. Kanakanhall, and S. W. Smoliar, "Automatic Partitioning of Full-Motion Video," Video and Image Processing on Multimedia System, Vol.1, pp. 10-28, 1993. 

  6. A. Nagasaka and Y. Tanaka "Automatic Video Indexing and Full-Video Search for Object Appearances," Proceeding of IFIP 2nd Working Conference. Visual Databases System, Vol.2, pp. 113-127, 1992. 

  7. C. L. Huang and B. Y. Liao, "A Robust Scene- Change Detection Method for Video Segmentation," IEEE Trans. on Circuits and System for Video Technology, Vol.11, pp. 1281-1288, 2001. 

  8. Z. Rasheed and M. Shah, "Video Categorization using Semantics and Semiotics," Video mining, pp. 185-217, 2003. 

  9. 고경철, 이양원, "변형된 $x^2$ -테스트와 자동 임계치-결정 알고리즘을 이용한 장면전환 검출 기법," 전자공학회논문지, 제42권, 제4호, pp. 51-58, 2005. 

  10. B. Truong, C. Dorai, and S. Venkatesh, "New Enhancements to Cut, Fade, and Dissolve Detection Processes in Video Segmentation," Proceedings of the 8th ACM International Conference on Multimedia, pp. 219-227, 2000. 

  11. 고경철, 최영일, 이양원, "플래시라이트에 강건한 장면전환 검출 알고리즘," 전자공학회논문지, 제43권, 제6호, pp. 83-91 2006년. 

  12. R. Lienhart, "Reliable Dissolve Detection," Proceeding of SPIE in Storage and Retrieval for Media Databases, Vol.4315, pp. 219-230, 2001. 

  13. A. Hanjalic and H. Zhang "Optimal Shot Boundary Detection Based on Robust Statistical Models," Proceedings of the IEEE International Conference on Multimedia Computing and Systems, Vol.2, pp. 710-714, 1999. 

  14. C. W. Ngo, T. C. Pong, and H. J. Zhang. "Motion Analysis and Segmentation Through Spatio-Temporal Slices Processing," IEEE Trans. on Image Processing, Vol.12, pp. 341-355, 2003. 

  15. 원인수, 이준우, 임대규, 정동석, "개선된 적응적임계값 결정 알고리즘과 후처리 기법을 적용한 동영상 분할 방법," 멀티미디어학회논문지, Vol. 13, pp. 663-673, 2010. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로