$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 시공간 정보를 이용한 자막 탐지 및 향상 기법
A Method for Text Detection and Enhancement using Spatio-Temporal Information 원문보기

韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information, v.14 no.8, 2009년, pp.43 - 50  

정종면 (국립 목포해양대학교 해양전자통신공학부)

초록
AI-Helper 아이콘AI-Helper

디지털 비디오에서 텍스트 정보는 비디오 데이터의 시청각적인 정보를 보강하고 부가 정보를 제공하기 때문에 방대한 멀티미디어의 내용을 예측할 수 있는 중요한 단서를 제공한다. 본 논문에서 제안된 방법은 주어진 영상열로부터 자막의 획 특징을 이용하여 자막을 탐지하고, 프로젝션을 이용하여 자막의 위치를 찾는다. 찾아진 자막을 포함하는 바운딩박스에 대한 기하학적인 검증을 거친 후, 서로 인접하는 프레임에 있는 바운딩박스 중 공간적으로 동일한 위치의 바운딩박스에 대한 MAD를 이용하여 바운딩박스를 추적하고, 시간적 중복성을 이용하여 바운딩박스 영역의 화질을 향상시킨다. 다양한 비디오에 대한 실험 결과는 제안된 방법의 타당성을 보인다.

Abstract AI-Helper 아이콘AI-Helper

Text information in a digital video provides crucial information to acquire semantic information of the video. In the proposed method. text candidate regions are extracted from input sequence by using characteristics of stroke and text candidate regions are localized by using projection to produce t...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 참고문헌 ⑺에서 제안한 방법으로 자막 영역을 탐지한 다음 비디오의 시공간적인(spatio-temporal) 특징을 이용하여 복잡한 배경을 갖는 비디오로부터 자막의 색상, 위치 등에 무관하게 자막을 강건하게 추출하기 위한 알고리즘을 제안한다. 그림 1은 제안하는 방법의 개략적인 흐름을 보이고 있는데, 그림에서 보이는 바와 같이 주어진 한 개의 프레임으로부터 자막의 존재 여부를 탐지한 후 자막의 위치를 찾아 바운딩박스로 표현한다.
  • 자막 영역을 효과적으로 찾기 위해서는 자막 영역에서 프로젝션의 peak가 강하게 나타나는 것이 바람직하다. 따라서 본 논문에서는 획 경계선의 내부를 채운 다음 프로젝션을 수행함으로써 프로젝션이 효과적으로 수행될 수 있도록 하였다. 이를 위하여 모폴로지 연산을 다시 한번 수행하여 인접한 획 경계선들을 통합한다.
  • 이 경우는 이전 프레임까지는 존재했던 텍스트가 현재 프레임에서 사라져 더 이상 존재하지 않는 경우와, 현재 프레임에 존재하지만 어떤 이유로 인해 대응 관계를 찾는데 실패한 경우를 포함하는데, 바운딩박스가 더 이상 존재하지 않는 경우는 BS(t)의 바운딩박스 시퀀스와 BS(tT)의시퀀스는 각각 BS(t-l)과 BS(t-2)에서 복사한 것이다. 따라서 본 논문에서는 바운딩박스 시퀀스 중 BS(t)와 BS(tT)이모두 복사된 시퀀스인 경우 사라진 자막으로 판단하고 자막 향상과정을 수행한다.
  • 본 논문에서 제안하는 자막 추출 기법의 타당성을 입증하기 위하여 다양한 비디오에 대한 실험을 수행하였다. 실험에 사용한 영상은 7*4280 0또는 9*5640 0해상도, 256단계의농담(gray scale) 값을 갖는 뉴스, 스포츠, 쑈 프로그램 등이다.
  • 본 논문에서는 시공간 정보를 이용하여 텍스트 정보를 효과적이고 강건하게 추출하기 위한 알고리즘을 제안하였다. 제안된 알고리즘은 각 프레임에 대해 자막이 될 가능성이 높은 픽셀을 의미하는 씨앗점을 추출하고 모폴로지 연산과 프로젝션 기법을 이용하여 자막 영역을 찾는다.
  • 보이고 있다. 본 논문에서는 두 바운딩박스의 겹쳐지는 영역이 일정 비율 이상일 경우 서로 대응될 가능성이 있다고 판단한다. 겹침 비율 은 (식 1)-(식 4)에 의해 계산된다.

가설 설정

  • 로 나누어서 자막의 위치를 찾는 하향식 접근 방법이 있다〔13T 4〕. 자막 분리 단계에서는 자막 영역을 이루는 픽셀은 다른 영역과는 다른 색상을 일관되게 갖는다는 가정 하에, 배경과 자막 영역을 분리해 낸다〔15〕. 한편, 획 정보를 이용하여 씨앗점을 추출한 다음 모폴로지를 적용하여 효과적으로 자막을 추출할 수 있는 알고리즘이 제안되었다〔7〕.
  • 존재한다. 기존의 연구들은 공통적으로 텍스트 영역은 배경과 높은 대비 (contrast)를 갖는다는 점을 가정하고 있으며, 텍스트가 수평 혹은 수직 방향으로 정렬되어 있다는 가정과 텍스트의 크기는 일정하다는 가정 하에 텍스트를 추출한다. 그러나 비디오에 존재하는 텍스트 정보는 그 해상도가 좋지 않고, 복잡한 배경, 다양한 폰트와 특수 효과의 영향 등으로 인해 다양한 장르의 비디오에 적용하기에 어렵다.
본문요약 정보가 도움이 되었나요?

참고문헌 (17)

  1. 신성윤, 표성배, 이양원, "대용량 비디오 데이터베이스 구축을 위한 비디오 개요 추출," 한국컴퓨터정보학회논문지, 제14권 1호, 255-265쪽, 2006년. 

  2. K. Jung, K. Kim, A. Jain, "Text Information extraction in images and video: a survey," Pattern Recognition, vol. 37, pp. 977-997, May 2004. 

  3. M. R. Lyu, J, Song, and M. Cai, "A Comprehensive Method for Multilingual Video Text Detection, Localization, and Extraction," IEEE Trans. on CSVT., vol. 15n no 2, Feb. 2005. 

  4. R. Lienhart and A. Wernicke, "Localizing and Segmenting Text in Images and Videos," IEEE Trans. on Circuits and Systems for Video technology, vol. 12, no. 4, pp. 256-268, Apr. 2002. 

  5. Y. Hasan and L. Karam, "Morphological Text Extraction from Images," IEEE Trans. on Image Processing, vol. 9, no. 11, Nov. 2000. 

  6. C. W. Lee, K. Jung, H. J. Kim, "Automatic text detection and removal in video sequences," Pattern Recognition Letters, vol. 24, pp. 2607-2623, Nov. 2003. 

  7. 정종면, 차지훈, 김규헌, "디지털 비디오를 위한 획기반 자막 추출 알고리즘," 퍼지 및 지능시스템학회 논문지, vol. 17, no. 3, pp. 297-303, 2007년 6월 

  8. H. Li, D. Doerman, and O. Kia, "Automatic text detection and tracking in digital video," IEEE Trans. on Image Processing, vol. 9, no. 1, pp. 147-156, Jan. 2000. 

  9. O. Shiku, Y. Xiao, H. Yan, "Extraction of character patterns in different styles and orientations from natural scene images," Proc. of 2004 Int. Symp. on Intelligent Multimedia, Video and Speech Processing, pp. 719-722, Oct. 2004. 

  10. A. Jian and S. Bhattacharjee, "Text segmentation using gabor filters for automatic document processing," Machine Vis. Applicat., vol. 5, pp. 169-184, 1992. 

  11. V. Wu, R. Manmatha, and E. Riseman, ?"Textfinder: An automatic system to detect and recognize text in images," IEEE Trans. on Pattern Analysis and Machine Intelligent, vol. 21. no. 11, pp. 1224-1229, Nov. 1999. 

  12. A. Jain and B. Yu, "Automatic text location in images and video frames," Pattern Recognition, vol. 31. no. 12, pp. 2055-2076, 1998. 

  13. M. Cai, J. Song, and M. Lyu, "A new approach for video text detection," Proc. of Int. Conf. on Image Process, pp. 117-120, Sep. 2002. 

  14. A. Wernicke and R. Lienhart, "On the segmentation of text in videos," Proc. of IEEE Int. Conf. on Multimedia Expo, vol. 3, pp. 1511-1514, Jul. 2000. 

  15. S. Antani, D. Crandall, and R. Kasturi, "Robust extraction of text in video," 15th Int. Conf. on Pattern Recognition, vol. 1, pp. 831-834, Sep. 2001. 

  16. W. Huang, P. Shivakumara and C. L. Tan, "Detecting Moving Text in Video Using Temporal Information," Proceedings of 19th ICPR, Dec. 2008. 

  17. D. Palma, J. Ascenso, F. Pereira, "Automatic Text Extraction in Digital Video Based on Motion Analysis," LNCS 3211 Image Analysis and Recognition, pp. 588-596, 2004. 

저자의 다른 논문 :

LOADING...

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로