$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

MPEG-7 기반 비디오/이미지 검색 시스템(VIRS)
MPEG-7 based Video/Image Retrieval System (VIRS) 원문보기

정보처리학회논문지. The KIPS transactions. Part B. Part B, v.10B no.5, 2003년, pp.543 - 552  

이재호 (한양대학교 대학원 전자전기컴퓨터공학부) ,  김형준 (한양대학교 대학원 전자전기컴퓨터공학부) ,  김회율 (한양대학교 전자전기공학부)

초록
AI-Helper 아이콘AI-Helper

멀티미디어데이터의 급격한 양적 팽창은 원하는 데이터를 빠르고 정확하게 검색해야 한다는 새로운 과제를 안겨주었다. 이러한 효율적 검색을 위해서 가장 중요한 기반이 되는 것이 바로 데이터의 적절한 표현이다. 2001년 국제 표준으로 제정된 MPEG-7은 바로 이러한 이유로 멀티미디어 데이터의 표현에 대한 표준화를 다루고 있다. 그러나 MPEG-7의 내용은 표준의 특성상 포함하는 범위가 방대하고 실제 검색시스템을 구축하려는 이들에게 다루기 힘든 것이 사실이다. 이에 본 논문에서는 MPEG-7에 제시되어 있는 표준 중 비주얼 기술자들만을 이용하여 간단한 검색시스템을 구축하는 방법에 대하여 제시하고 그 검색 결과를 도시하였다. 또한 개발된 시스템인 MPEG-7 VIRS(Video/Image Retrieval System)의 검색 결과를 통하여 각 비주얼 기술자를 이용한 검색과 다중 기술자들의 조합을 이용한 검색간의 결과를 분석하였으며 앞으로 MPEG-7을 이용한 검색 시스템이 나아갈 방향에 대한 간단한 제시를 하고 있다.

Abstract AI-Helper 아이콘AI-Helper

An increasing in quantity of multimedia data brought a new problem that expected data should be retrieved fast and exactly. The adequate representation is a key element for the efficient retrieval. For this reason, MPEG-7 standard was established for description of multimedia data in 2001. However, ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 그래서, 본 논문에서는 모든 기술자들의 조합에 대한 성능평가는 자제하려 한다. 이는 앞에서 설명하였듯이 각각 칼라와 질감 모양과 그리고 움직임 기술자가 표준화를 제정할 때 사용한 데이터 셋이 다르기 때문이다.
  • 이는 그 성능이 월등하지 않다는 것은 아니라 저자의 주관적인 판단에 따라 본 시스템 구현에 적합하지 않거나 기술자 추출이 용이하지 않은 것들은 배제하였다. 그러면 이제 MPEG-7 VIRS에 사용한 각 기술자들에 대한 특성들만 간단히 설명하도록 하겠다.
  • 이러한 시도는 실제 검색 시스템의 개발에 있어, 기존의 연구에서 접근한 하나의 기술자에 대한 검색 결과는 다양한 시스템 개발에 충분한 정보를 제공하지 못하기 때문이다. 그러므로, 객관적으로 입증된 하나의 데이터 셋에 대하여 다수의 기술자를 이용한 검색 결과를 유도하고, 이를 통한 다수 기술자조합의 성질을 연구함으로써 향후 MPEG-7 검색 시스템개발에 기여하고자 함이다. 이에 본 논문에서는 사용된 세 개의 칼라 기술자를 모두 사용한다는 전재 하에 가중치를 조절해가면서 현재의 조건하에서 가장 좋은 결과를 가질 때의 검색 결과 값을 구해 보았다.
  • 이는 앞에서 설명하였듯이 각각 칼라와 질감 모양과 그리고 움직임 기술자가 표준화를 제정할 때 사용한 데이터 셋이 다르기 때문이다. 기술자들의 조합들 통한 검색 결과의 분석을 위하여, 본 논문에서는 가장 실제의 영상들과 상관도가 높다고 판단되는 CCD에 대하여각2? 의 기술자들에 대한 성능을 평가하고 이를 도시하였다. CCD이미지 5446장은 총 50개의 그룹으로 구성되어 있으며 이어 대한 내용분석과 각 그룹의 이미지들에 대한 설명은 MPEG-7 문서에 자세히 기록 되어 있다[25].
  • 한다. 또한 개발된 검색 시스템인 MPEG-7 VIRS(Video /Image Retrieval System)의 성능 평가를 위하여 조합된 비주얼 기술자들을 통한 검색 결과를 분석하고 MPEG-7의실제 검색 시스템의 개발에 필요한 요소들을 점검해보려 한다.
  • 영역 그리고 얼굴 등의 형태로 구성되어 있다. 개발에서는 하나의 기술자가 아닌 대부분의 비주얼 기술자 의사용을 목적으로 하고 있다. 본 개발에 사용된 기술자들을 열거하면<표 2>와 같다.
  • 본 논문에서는 CCD에 대하여 MPEG-7 기술자 중 하나의 기술자가 아닌 다수의 기술자를 이용하여 영상 검색에 적합한 조합을 유도하려고 시도하였다. 이러한 시도는 실제 검색 시스템의 개발에 있어, 기존의 연구에서 접근한 하나의 기술자에 대한 검색 결과는 다양한 시스템 개발에 충분한 정보를 제공하지 못하기 때문이다.
  • 본 논문에서는 MPEG-7의 비주얼 기술자들만을 기용한 이미지 및 동영상을 위한 검색 시스템인 MPEG-7 VIRS에대하여 구성과 그 검색 성능을 보였다. 이는 비주얼 기술자만을 이용하여 사람의 개입 없이 자동으로 검색 시스템을 구축할 수 있는 MPEG-7 검색 시스템을 위한 하나의 프로토 타입을 보인 것이다.
  • 또한 프로파일링 작업등을 통하여 실제 어플리케이 션에 이용될 형태 등에 대하여 논의하고 있는 실정이다. 논문에서는 표준의 구성 중 Part-3인 비주얼 기술자들만을 이용하여 검색 시스템을 구현하는 것을 목적으로 하였다. 이는 비주얼 기술자가 기술자 생성시에 별도의 입력 절차 없이 자동으로 표현될 수 있으며 이로 인해 시스템을 간단하게 구현할 수 있기 때문이다.
  • 즉, 정규화의 과정과 刀중치의 방식을 접목하여 CCD 데이터셋에 대한 검색 결과의 성능 향상을 보이는 칼라 기술자들의 조합을 계산하는 것이다. 본 논문의 목적은 현재의 시스템에서 완벽한 조화를 이루는 최고의 조합을 찾으려는 것이 아니라, 개발자들에게 MPEG-7 검색 시스템 구현과 검색 성능 분석의 하나의 지침을 주는 데에 그 의미가 있다고 하겠다. 기존의 다른 검색 시스템에서 사용되었던 피드백을 이용한 검색성능의 향상 및 신경망이나 각종 흐습 방법을 이용한 최상의 특징 조합값의 구현 등에 대한 내용은 본 논문게서는포함하지 않고 있다.
  • 본 움직임 기술자는 카메라의 움직임을 panning, zooming 등의 분류를 통하여 3차원적으로 기술하기 위하여 정의되었으며, 각각의 움직임에 대한 정도를 표현하고 있다.
  • 본 칼라 기술자의 목적은 공간적 정보와 칼라 정보를 동시에 이용하려는데 있다. 즉 이미지를 가로 8, 세로 8 크기의 영상으로 변형하고 각 영역의 칼라 정보를 구하는 것이다.
  • 한다. 이는 검색 시스템 개발자들과 연구자들에게 실제 개발된 검색 시스템에 대한 정보를 공유함으로써개발되어질 검색 시스템에 대한 길잡이를 주고자 그 목적이 있다.
  • 그러나 이러한 데이터 표현의 불일치성은 하나의 데이터에 대해서도 서로 다른 표현으로 나타나게 되므로, 데이터 표현에대흔: 불필요한 중복성을 유발시킨다. 이러한 표현에 대한이질감을 극복하여 동일한 데이터 표현으로 나타내게 하고자 하는 것이 바로 MPEG-7 표준화의 목적이라 하겠다.
  • 그러므로, 객관적으로 입증된 하나의 데이터 셋에 대하여 다수의 기술자를 이용한 검색 결과를 유도하고, 이를 통한 다수 기술자조합의 성질을 연구함으로써 향후 MPEG-7 검색 시스템개발에 기여하고자 함이다. 이에 본 논문에서는 사용된 세 개의 칼라 기술자를 모두 사용한다는 전재 하에 가중치를 조절해가면서 현재의 조건하에서 가장 좋은 결과를 가질 때의 검색 결과 값을 구해 보았다. 위의 그림은 세 기술자의 가중치를 동일하게 1로 설정하였을 때와 가중치의 조정으로 가장 좋은 검색 결과를 나타냈을 때의 결과를 도시하였다.
  • 이에 본 논문에서는 하나의 기술자만을 사용한 시스템이 아닌 표준에 제안되어 있는 대부분의 비주얼 기술자를 사용하여 검색시스템을 제작하는 과정과 그의 결과를 제시하려 한다. 또한 개발된 검색 시스템인 MPEG-7 VIRS(Video /Image Retrieval System)의 성능 평가를 위하여 조합된 비주얼 기술자들을 통한 검색 결과를 분석하고 MPEG-7의실제 검색 시스템의 개발에 필요한 요소들을 점검해보려 한다.
  • 그러나, 표준이 제정되고 공표된 현재는 새로운 MPEG-7을이용한 검색 시스템의 개발이 필요하다. 이에 본 연구는 MPEG-7 표준이 실제 검색 시스템에서 어떻게 사용되어질수 있는지에 대한 예시와 그 검색 결과를 보이려 한다. 본 시스템의 특징 추출과정과 유사도 측정은 MPEG-7표준의 XM 문서와 소프트웨어를 참조하여 제작하였다[23, 24].
  • 이제 이러한 각 기술자들의 조합을 이용하여 검색 결과를 확인하여 보았다. 아래 그림은 두 개의 조합만을 이용하여 검색한 결과를 도시한 것이다.
  • 이는 본 시스템이 각 기술자에 대한 가중치를 조정할 수 있다는 점을 이용한 것이다. 즉, 정규화의 과정과 刀중치의 방식을 접목하여 CCD 데이터셋에 대한 검색 결과의 성능 향상을 보이는 칼라 기술자들의 조합을 계산하는 것이다. 본 논문의 목적은 현재의 시스템에서 완벽한 조화를 이루는 최고의 조합을 찾으려는 것이 아니라, 개발자들에게 MPEG-7 검색 시스템 구현과 검색 성능 분석의 하나의 지침을 주는 데에 그 의미가 있다고 하겠다.

가설 설정

  • 이는 간단한 최소값과 최대값을 통한 정규화는 어떤 영상에서 각 기술자에 따라 유사도 차이 값의 변화가 완전히 달라질 수 있다는 것이다. 두 번째로 기술자를 표현하는 빈의 숫자가 모두 다르다는 것이다. 이는 가중치를 지금처럼 절반씩 준 경우 어느 하나에 기술자에는 많은 영향을 미칠 수도 있다는 것이다.
본문요약 정보가 도움이 되었나요?

참고문헌 (27)

  1. S. F. Chang, 'Overview of the MPEG-7 Standard,' IEEE Trans. On Circuits and Systems for Video Technology, Vol.11, No.6, pp.799-695, June, 2001 

  2. R. B. Johnson, 'Multimedia databases and MPEG-7,' Electronics & Communication Engineering Journal, issue 3, Vol.13, pp.98-99, June, 2001 

  3. S. Jeannin and A. Divakaran, 'MPEG-7 visual motion descriptors,' IEEE Transactions on Circuits and Systems for Video Technology, Vol.11, No.6, pp.720-724, June, 2001 

  4. M. Bober, 'MPEG-7 visual shape descriptors,' IEEE Trans. on Circuits and Systems for Video Technology, Vol.11, No.6, pp.716-719, June, 2001 

  5. D. S. Messing, P. Van Beek and J. H. Errico, 'The MPEG-7 colour structure descriptor : image description using colour and local spatial information,' PROC. International Conference on Image Proccessing, Vol.1, pp.670-673, 2001 

  6. T. Echigo, K. Masumitsu, M. Teraguchi, M. Etoch and S. Sekihuchi, 'Personalized delivery of digest video managed or MPEG-7,' Information Technology : Proc. Coding and Computing, pp.216-210, 2001 

  7. N. Fatemi and O. A. Khaled, 'Indexing and retrieval of TV news programs based on MPEG-7,' Proc. International Conference on Consumer Electronics, pp.360-361, 2001 

  8. T. Ebrahimi, Y. Abdeljaoued, R. M. Figueras i Ventura and O. Divorra Escoda, 'MPEG-7 camera,' Proc. International Conference on Image Processing, Vol.3, pp.600-603, 2001 

  9. J. R. Smith and S. F. Chang, 'VisualSEEK : A Fully Automated Content-Based Query System,' Proc. ACM Multimedia, pp.87-98, 1996, http://disney.ctr.columbia.edu/WebSEEK 

  10. S. Mehrotra, Y. Rui, M. Ortega-Binderberger and T. S. Huang, 'Supporting Content-Based Queries over Images in MARS,' Proc. IEEE Int'1 Conf. on Multimedia Computing and Systems, pp.632-633, June, 1997, http://jadzia.iip.uiuc.edu : 8001/. 

  11. M. Thomas, C. Carson and J. M. Hellerstein, 'Creating a Customized Access Method for Blobworld,' Proc. 16th International Conference on Data Engineering, pp.82-82, 2000, http://elib.cs.berkeley.edu/photos/blobworld 

  12. W. Niblack, et al, 'Updates to the QBIC system,' Proc. SPIE on Storage and Retrieval for Image and Video Databases, Vol.6, pp.150-161, 1998, http://wwwqbic.almaden.bm.com/ 

  13. Pentland, R. W. Picard and S. Scarlo, 'Photobook : Tools for Contest-Based Manipulation of image Databases,' Proc.SPIE on Storage and Retrieval for Image and Video Databases II, Vol.2, Issue 185, pp.34-47, 1994, http://whitechapel.media.mit.edu/vismod/demos/photobook 

  14. A. Gupta, et al 'The Virage image search engine : an open framework for image management,' Proc. SPIE on Storage and Retrieval for Image and Video Database Vol.4, pp.76-87, 1996, www.virage.com 

  15. S. Ravela and R. Manmatha, 'On computing global similarity in images,' Proc. IEEE Workshop on Applications of Computer Vision (WACV98), Princeton, NJ, pp.82-87, 1998, http://cowarie.cs.umass.edu/~demo/ 

  16. C. Nastar, 'Surfimage : a flexible content-based image retrieval system,' Proc.ACM Multimedia '98, Bristol, UK. 1998, http://www-syntim.inria.fr/htbin/syntim/surfimage/surfimage.cgi 

  17. W. Y. Ma and B. S. Manjunath, 'NeTra : a toolbox for navigating large image databases,' Proc. International Conference on Image Processing, Vol.1, pp.568-571, 1997, http://vivaldi.ece.ucsb.edu/Netra 

  18. M. G. Christel, R. B. Allen and E. Rasmussen, 'Multimedia abstractions for a digital video library,' Proc. ACM Digital Libraries '97, pp.21-29, http://www.islip.com/fprod.htm 

  19. I.J. Cox, M.L. Miller, T.P. Minka, T.V. Papathomas and P.N. Yianilos, 'The Bayesian Image Retrieval System;PicHunter: Theory, Implementation and Psychophysical Experiments,' IEEE Trans. Image Processing, Vol.9, No.1, pp.20-37, 2000 

  20. S. Kulkarni, B. Verma, P. Sharma and H. Selvaraj, 'Content Based Image Retrieval Using a Neuro-Fuzzy Technique,' Proc. IEEE Int'l Joint Conf. on Neural Networks, pp.846-850, July, 1999 

  21. B. S. Manjunath, et al., 'Introduce to MPEG-7,' John Wiley & Sons Ltd., West Sussex, England, 2002 

  22. ISO/IEC 15938-3, 'Multimedia Content Description Interface-Part 3 : Visual,' version 1, 2001 

  23. A. Yamada, M. Pickering, S. Jeannin, L. Cieplinski, J. R. Ohm and M. C. Kim, 'MPEG-7 Visual part of experimentation Model Version 10.0,' ISO/IEC JTCI/SC29/WG11/N4063, Singapore, March 2001 

  24. http://www.lis.e-technik.tu-muenchen.de/research/bv/topics/mmdb/e_mpeg7.html, MPEG-7 Experimental Model Software 

  25. D. Zier and J-R. Ohm 'Common Datasets and Queries in MPEG-7 Color Core Experiments,' ISO/IEC JTCI/SC29/WG11/M5060, Melbourne, October, 1999 

  26. P. Ndjiki-Nya et al., 'Subjective Evaluation of the MPEG-7 Retrieval Accuracy Measure (ANMRR),' ISO/IEC JTC/SC29/WG11/M6029, Geneva, May, 2000 

  27. ISO/IEC 15938-3, Multimedia Content Description Interface: MDS,' version 1, 2001 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로