$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

SOM 기반 웹 이미지 분류에서 고수준 텍스트 특징들의 효과
The Effectiveness of High-level Text Features in SOM-based Web Image Clustering 원문보기

정보처리학회논문지. The KIPS transactions. Part B. Part B, v.13B no.2 = no.105, 2006년, pp.121 - 126  

조수선 (국립충주대학교 컴퓨터과학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 웹 이미지의 분류 효과를 높이기 위해 이미지 자체에서 추출된 저수준의 비주얼 특징뿐만 아니라 이미지와 관련된 텍스트 정보로부터 나온 고수준 시맨틱 특징들을 이용하는 분류 방법을 제안한다. 이 고수준의 텍스트 특징들은 이미지 URL, 파일명, 페이지 타이틀, 하이퍼링크 및 이미지 주변 텍스트로부터 얻어진다. 분류 엔진으로는 Kohonen의 SOM(Self Organizing Map)을 사용한다. 고수준의 텍스트 특징들과 저수준의 비주얼 특징들을 동시에 사용하는 SOM 기반의 이미지 분류에서는 10개의 카테고리로부터 수집된 200개의 테스트 이미지들이 사용되었다. 분류 성능을 평가하기 위해 간단하면서도 새로운 두 가지 척도, 즉 동일 카테고리 이미지들의 산포 정도와 집적 정도를 나타내는 각각의 척도를 정의하고 사용하였다. 실험결과, SOM기반의 웹 이미지 분류에서는 고수준의 텍스트 특징들이 보다 유용한 것임이 밝혀졌다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose an approach to increase the power of clustering Web images by using high-level semantic features from text information relevant to Web images as well as low-level visual features of image itself. These high-level text features can be obtained from image URLs and file names,...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 나머지 2가지 특징 벡터들의 조합, 즉 25차원의 칼라 및 텍스트 특징 벡터, 그리고 20차원의 질감 및 텍스트 특징 벡터를 사용하였을 때 각각의 S0M 분류 맵 형태는 (그림 3)과 뚜렷한 차이가 없고 정량적인 비교가 어려웠다. 따라서 좀 더 구체적인 분석을 위해 분류의 성능을 나타내는 정량적인 척도를 도입하여 비교해 보고자 한다.
  • 본 논문에서는 SOM기반의 웹 이미지 분류에 대한 새로운 시도를 소개하였다. 이 시도는 분류하고자 하는 이미지의 특징으로 저수준의 비주얼 특징뿐만 아니라 고수준의 텍스트 특징을 동시에 이용하는 것이며, 그 결과 얼마만큼의 분류기 성능의 향상이 있었는지 측정해 보고자 하는 것이었다.
  • 이를 위해서는 분류 결과를 분석하고 성능을 측정할 수 있는 도구가 필요하다. 본 논문에서는 서로 다른 이미지 특징 벡터를 사용하였을 때 나타나는 분류기의 성능을 측정하기 위한 도구로서, 동일 카테고리로부터 나온 이미지들의 산포 정도와, 역시동일 카테고리로부터 나온 이미지들이 하나의 결과 분류 노드에 집적되는 정도를 나타내는 척도를 제안한다. 먼저 어떤 카테고리 에 대하여 산포 정도를 나타내는 척도인 S, 는 다음과 같이 정의된다.
  • 본 논문에서는 웹 이미지 분류에서 저수준의 비주얼 특징들뿐만 아니라 웹 이미지와 관련된 텍스트 정보로부터 나온 고수준의 시맨틱 특징들을 이용함으로써 분류 성능을 얼마나 높일 수 있는지 실증적으로 확인해 보고자 한다. 이들 고수준 텍스트 특징들은 이미지 URL, 파일명, 페이지 타이틀, 그리고 주변 텍스트들로부터 얻어진다.
  • 본 연구에서 우리의 시도는 SOM에 기반한 웹 이미지 클러스터링이며, 이미 기존의 연구에서 SOM을 이용한 웹 이미지의 분류 또는 검색에 관한 것을 찾아볼 수 있다. 연구[8]에서는 SOM을 이용한 컨텐트 민감형의 풍부한 속성을 가진 이미지 분류기를 발표하였다.
  • 웹 이미지 검색에서 SOM을 기반으로 하거나, 텍스트 특징들을 이용한 여러 관련 연구와 달리, 본 연구의 관심은 SOM 기반의 분류기에서 텍스트 특징을 이용할 때 분류의 성능이 얼마나 좋아지는가를 밝히는 데 있다. 따라서 우리는 두 가지 종류의 이미지 특징 벡터인 저수준 비주얼 특징 벡터와 고수준 텍스트 특징 벡터를 따로 구성하고, 200개의 웹이미지로부터 이들 특징들을 추출하여 분류에 이용하였다.
  • 소개하였다. 이 시도는 분류하고자 하는 이미지의 특징으로 저수준의 비주얼 특징뿐만 아니라 고수준의 텍스트 특징을 동시에 이용하는 것이며, 그 결과 얼마만큼의 분류기 성능의 향상이 있었는지 측정해 보고자 하는 것이었다. 이를 위해 두 가지 종류의 이미지 특징들을 서로 다른 조합으로 묶어서 SOM 기반 분류기에 적용하여 그 성능을 평가하였다.

가설 설정

  • 웹 페이지 제목 및 하이퍼링크-웹 페이지 제목과 이미지의 하이퍼링크들은 이미지 내용과 관련이 있을 수 있다. 따라서 이들 또한 이미지의 텍스트 특징 소스로 이용될 수 있다.
  • 이미지 파일명과 URL-대체로 웹 이미지에는 의미있는 이름이 지정된다. 그러나 파일명과 URL의 유용성을 높이기 위해 다음과 같은 몇 가지 처리가 필요하다.
  • 질감 특징들-질감은 영역 또는 블록 형태의 근접 특징으로 정의된다. 근접한 픽셀에 대한 각 픽셀의 변화량이 질감을 결정하는 것이다.
본문요약 정보가 도움이 되었나요?

참고문헌 (14)

  1. D. Arotaritei and S. Mitra, 'Web mining: a survey in the fuzzy framework, ' Fuzzy Sets and Systems, Vol.148, pp.5-19, 2004 

  2. N. Gudivada and V. Ragahavan 'Content-based image retrieval systems,'IEEE Computer, Vol.28, No.9, pp.18-22,1995 

  3. Y. Rui, T. Huang and S. Chang, 'Image retrieval: current techniques, promising directions and open issues, ' Journal of Visual Communication and Image Representation, Vol.10, No.4, pp.39-62, 1999 

  4. A.W.M. Smeulders, M. Worring, S. Santini, A.Gupta and R. Jain, 'Content-based image retrieval at the end of the early years,' IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.22, pp.1349-1379, 2000 

  5. Z. Chen, L. Wenyne, F. Zhang, M. Li and H. Zhang, 'Web Mining for Web Image Retrieval,' Journal of the American Society for Information Science and Technology, Vol.52, No. 10, pp.831-839, 2001 

  6. Y.Lu, C. Hu,X. Zhu,H. Zhang and Q. Yang,'A unified framework for semantics and feature based relevance feedback in image retrieval systems,' In proceedings of the 8th ACM international Conference on Multimedia, pp.31 - 38, 2000 

  7. T. Kohonen, 'Self-Organizing Maps', New York: SpringerVerlag, 1997 

  8. S.W.K. Chan and M.W.C. Chong, 'Unsupervised clustering for nontextual web document classification,' Decision Support Systems, Vol.37, pp.377-396, 2004 

  9. J. Laaksonen, M. Koskela, S. Laakso and E. Oja, 'PicSOM-content-based image retrieval with self-organizing maps,'Pattern Recognition Letters, Vol.21, pp.1199-1207, 2000 

  10. J. Laaksonen, M. Koskela, S. Laakso and E. Oja, 'Self-organizing maps as a relevance feedback technique in content-based image retrieval,' Pattern analysis & Applications, Vol.4, pp.140-152, 2001 

  11. J. Laaksonen, M. Koskela and E. Oja, 'PicSOM-Self-organizing image retrieval with MPEG-7 content descriptions,' IEEE Transactions on Neural Networks, Special Issue on Intelligent Multimedia Processing, Vol.13, pp.841-853, 2002 

  12. S. E. Umbaugh, Y. Wei, and M. Zuke, 'Feature Extraction in Image Analysis,' IEEE Engineering in Medicine and Biology, Vol.16, pp.62-73, 1997 

  13. T. Chang and C.-C.J. Kuo, 'Texture analysis and classification with tree-structured wavelet transform,' IEEE Tr. IP, Vol.2, pp.429-441, 1993 

  14. G. Salton, 'Automatic Text Processing', Addison-Wesley, pp.279-281, 1989 

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로