본 논문에서는 캐릭터 이미지 검색에 가장 적합한 컬러와 모양 정보를 표현하는 새로운 복합 특징량을 제안한다. 제안된 방법은 YCbCr 컬러 모델에서 얻어진 Y이미지에 대해서는 회전, 이동, 크기 변화에 불변한 Zernike 모멘트를 사용하여 모양 정보를 추출하고, Cb 및 Cr 이미지로부터 DCT계수를 사용하여 색상 정보를 추출하여 캐릭터 이미지를 검색한다. 이 방법은 인간의 시각적인 특성을 잘 표현하는 방법으로서 36개의 적은 특징량으로 높은 검색효율을 나타내기 때문에 대용량 데이터베이스와 같은 웹 검색과 애니메이션 검색에 적합한 방법이다. 캐릭터 이미지 3,834개를 대상으로 실험하였으며 MPEG-7 컬러/질감, 기술자들의 성능 평가에 사용된 ANMRR(Average of Normalized Modified Retrieval Rank)과 모션/모양 기술자들의 성능 평가에 사용된 BEP(Bull's Eye Performance)를 사용하여 캐릭터 이미지 검색에서 우수한 성능을 타나냄을 실험으로 확인하였다.
본 논문에서는 캐릭터 이미지 검색에 가장 적합한 컬러와 모양 정보를 표현하는 새로운 복합 특징량을 제안한다. 제안된 방법은 YCbCr 컬러 모델에서 얻어진 Y이미지에 대해서는 회전, 이동, 크기 변화에 불변한 Zernike 모멘트를 사용하여 모양 정보를 추출하고, Cb 및 Cr 이미지로부터 DCT계수를 사용하여 색상 정보를 추출하여 캐릭터 이미지를 검색한다. 이 방법은 인간의 시각적인 특성을 잘 표현하는 방법으로서 36개의 적은 특징량으로 높은 검색효율을 나타내기 때문에 대용량 데이터베이스와 같은 웹 검색과 애니메이션 검색에 적합한 방법이다. 캐릭터 이미지 3,834개를 대상으로 실험하였으며 MPEG-7 컬러/질감, 기술자들의 성능 평가에 사용된 ANMRR(Average of Normalized Modified Retrieval Rank)과 모션/모양 기술자들의 성능 평가에 사용된 BEP(Bull's Eye Performance)를 사용하여 캐릭터 이미지 검색에서 우수한 성능을 타나냄을 실험으로 확인하였다.
In this paper, we propose a new composite feature consists of both color and shape information that are suitable for the task of character image retrieval. This approach extracts shape-based information using Zernike moments from Y image in YCbCr color space. Zernike moments can extract shape-based ...
In this paper, we propose a new composite feature consists of both color and shape information that are suitable for the task of character image retrieval. This approach extracts shape-based information using Zernike moments from Y image in YCbCr color space. Zernike moments can extract shape-based features that are invariant to rotation, translation, and scaling. We also extract color-based information from the DCT coefficients of Cr and Cb image. This approach is good method reflecting human visual property and is suitable for web application such as large image database system and animation because higher retrieval rate has been achieved using only 36 features. In experiment, this method is applied to 3,834 character images. We confirmed that this approach brought about excellent effect by ANMRR(Average of Normalized, Modified Retrieval Rank), which is used in the evaluation measure of MPEG-7 color descriptor and BEP(Bull's Eye Performance), which is used in evaluation measure of shape descriptor in character image retrieval.
In this paper, we propose a new composite feature consists of both color and shape information that are suitable for the task of character image retrieval. This approach extracts shape-based information using Zernike moments from Y image in YCbCr color space. Zernike moments can extract shape-based features that are invariant to rotation, translation, and scaling. We also extract color-based information from the DCT coefficients of Cr and Cb image. This approach is good method reflecting human visual property and is suitable for web application such as large image database system and animation because higher retrieval rate has been achieved using only 36 features. In experiment, this method is applied to 3,834 character images. We confirmed that this approach brought about excellent effect by ANMRR(Average of Normalized, Modified Retrieval Rank), which is used in the evaluation measure of MPEG-7 color descriptor and BEP(Bull's Eye Performance), which is used in evaluation measure of shape descriptor in character image retrieval.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
Zemike 모멘트는 패턴의 영역을 토대로 특징량을 추출하기 때문에 경계선 패턴의 모양으로 검색하는 방법들의 많은 단점을 극복할 수 있고, 회전 불변 및 잡음에 강인하기 때문에 패턴 인식 시스템에 널리 사용되어 왔다. 또 이미지 정규화 알고리즘에서의 약점인 회전에 불변하지 않은 특징을 보완해 준다. 본 논문에서는 정규화된 이미지로부터 모양 정보를 추출하기 위한 특징 벡터로는 DC 값인 0차 모멘트 값을 제외한 8차까지의 Zernike 모멘트의 절대값 24개를 사용하였다.
캐릭터 이미지는 표현되는 주된 대상이 전체적인 모양과 색상이 주된 특징이기 때문에 본 논문에서는 캐릭터 이미지 검색에 가장 적합한 컬러와 모양 정보를 동시에 표현하는 새로운 복합 특징량을 제안한다. YCbCr 컬러 모델상에서 얻어진 Y이미지에 대해서는 정규 모멘트를 기반으로 이미지 정규화 알고리즘을 적용하여 이미지를 정규화 한 후, Zernike 모멘트를 사용하여 회전, 이동, 크기, 비틀림의 변화에 불변한 모양 특징량을 추출한다.
제안 방법
J. Huange Color Correlogram이라는 새로운 방법을 제안하였다. 이 방법은 이미지 내의 화소로부터 특정 거리만큼 떨어진 점들에 대해 해당 화소의 빈도 수를 표시한 히스토그램으로 이미지를 비교하는 것으로, 색상 정보와 공간 정보를 효과적으로 결합하였으나, 다른 컬러와의 상관관계를 고려하지 않은 단점이 있다.
Cb, Cr 이미지의 히스토그램 분포를 살펴보면 일정한 값들의 범위 내로 몰려있는 것을 볼 수 있는데 이러한 특징이 DCT 변환을 사용하여 몇 개의 계수 만으로 효율적인 색상 정보를 추출하게 한다. JPEG압축 알고리즘에서 사용하는 지그재그 스캔 방식을 사용하여 2D-DCT 변환된 색상 이미지에 대해 6개의 특징벡터를 추출한다. 추출된 계수는 1개의 DC성분과 5개의 AC성분을 나타낸다.
Pass는 이미지 내에서 같은 색상의 응집 여부를 이용한 CCV( Color Coherence Vectors) 를 제안하여 기존의 색상 히스토그램 방법을 개선하였으나, 공간 정보가 극히 적다는 단점이 지적 되었다. M. K. Mandale 색 정보를 반영하기 위해서 색상 히스토그램에 대한 모멘트를 이용하였고, 공간 정보 반영을 위해 웨이브릿 부이미지를 가우시안 분포로 근사한 후 그 계수를 사용하였다. 이 방법은 특징량의 수가 적어 색인에는 용이하지만.
이미지들을 보여준 것이다. Y이미지를 정규화 할 때 스켈링 펙터를 20으로 하여 120x120크기로 이미지를 정규화 하였으며 이진 영상으로 변환하는 과정에서 배경을제거하기위해 임계치를 230로 두고 실험하였다. 또 유사도 즉정 시 가중치를 S= 1, # = 1, #3= 1로 하였을 때 가장 좋은 결과를 얻을 수 있었다.
과거의 텍스트에 기반한 검색 방법의 문제점을 극복하기 위해 이미지 자체의 특징인 색상, 질감, 모양 및 객체들의 상대적인 위치 같은 것을 이용하여 이미지를 검색하는 방법이 연구되었다. 일반적으로, 사람들은 두 개의 이미지를 비교할 때 "이 두 이미지는 모양이 같다", "질감이 같다 또는 색깔이 같다" 라고 평가를 하게 된다.
그림 6에서 보는 바와 같이 캐릭터 이미지 특성상 정적인 이미지보다 활동적인 캐릭터 이미지가 많기 때문에 전처리 과정으로 Gaussian blurring을 이용하여 캐릭터 이미지의 미세한 모양의 변화에 대한 윤곽을 부드럽게 하고, 패턴내의 미세한 구멍 같은 것을 채우게 한 다음, 캐릭터 이미지의 모양에 대한 영역을 얻기 위해 이진 이미지로 변환한다. 그 변환된 이미지가 이동, 크기 및 비틀림에 변화에 불변하기 위해 이미지를 정규화 한다.
표 1에서 보는 바와 같이 높은 차수일 때 검색률이 약간 떨어지는 것을 볼 수 있는데 이것은 차수가 높아짐에 따라 모양의 미세한 변화를 표현하기 때문에 비슷한 모양을 검색하는 데에는 원하지 않은 것이 된다. 따라서 8차 이상은 검색률에 변화가 거의 없으면서 특징량이 작기 때문에 본 논문에서는 DC 값인 0차 항을 제외한 8차 24개를 특징량으로 사용하였다.
YCbCr 컬러 모델상에서 얻어진 Y이미지에 대해서는 정규 모멘트를 기반으로 이미지 정규화 알고리즘을 적용하여 이미지를 정규화 한 후, Zernike 모멘트를 사용하여 회전, 이동, 크기, 비틀림의 변화에 불변한 모양 특징량을 추출한다. 또 Cb와 Cr이미지로부터 DCT계수를 사용 색상 성보를 추출한 다음 이러한 복합 특징량으로 캐릭터 이미지를 검색한다.
있는 큰 장점도 가지고 있다. 또 이 방법은 인간의 시각적인 특성을 잘 표현하는 방법으로서 36개의 매우 적은 특징량으로 검색하므로 대용량 데이터베이스와 같은 웹 겸색 시스템과 애니메이션 검색에 적합한 방법을 제시하였다.
5개의 AC성분은 색상 이미지에 대한 질감 정보를 나타낼 수 있는 정보량이기도 하다. 마지막으로 특징량 값들을 0 과 1사의 값을 갖기 위해 특징량들을 정규화 하는데 본 논문에서는 선형 정규화 방법으로 정규화 하였다. 그림 5 는 앞에서 설명한 색상 이미지의 특징량 추출 과정을 그림으로 나타낸 것이다.
마지막으로, 전처리 과정에서 얻어진 정규화된 이미지에 대해서 Zemike 모멘트를 이용하여 특징벡터를 추출한다. Zemike 모멘트는 패턴의 영역을 토대로 특징량을 추출하기 때문에 경계선 패턴의 모양으로 검색하는 방법들의 많은 단점을 극복할 수 있고, 회전 불변 및 잡음에 강인하기 때문에 패턴 인식 시스템에 널리 사용되어 왔다.
본 논문에서 제안하는 모양 정보의 추출 방법은 그림 1 에서 보는 바와 같이 YCbCr 컬러 모델에서 얻어진 Y 이미지에 대해서 모양 정보를 추출 한다. 그림 6에서 보는 바와 같이 캐릭터 이미지 특성상 정적인 이미지보다 활동적인 캐릭터 이미지가 많기 때문에 전처리 과정으로 Gaussian blurring을 이용하여 캐릭터 이미지의 미세한 모양의 변화에 대한 윤곽을 부드럽게 하고, 패턴내의 미세한 구멍 같은 것을 채우게 한 다음, 캐릭터 이미지의 모양에 대한 영역을 얻기 위해 이진 이미지로 변환한다.
표 2 에서 보는 바와 같이 계수가 6개일 때 가장 좋은 검색률을 나타내고 계수의 수가 10이상일 때 검색률이 약간 감소하는 것을 볼 수 있는데 이것은 AC성분이 증가하므로 해서 컬러 이미지 내에 있는 질감 성분을 많이 포함하는 것으로 캐릭터 이미지를 검색하는데 원하지 않는 성분임을 나타낸다. 본 논문에서는 색상 성분 이미지에 대해 각각 6개씩 12개의 특징량을 사용하였다.
성능 분석 지표로는 현재 MPEG-7 컬러/질감에 대한 성능평가 방법인 ANMRR( Average of Normalized Modified Retrieval Rank)#과 모션/모양에 대한 성능평가 방법인 BEP(Bull's Eye Performance)'저'로서 성능 평가하였다. 다음 식은 ANMRR을 구하는 식이다.
Lam 등은 STAR (System for Trademark Archive and Retrieval)라는 상표 검색 시스템을 제안했다[10]. 이 시스템에서는 사용자가 지정한 상표의 중요 특징으로부터 추출한 불변 모멘트와 퓨리에 기술자를 특징 벡터로 사용하고, 상표들 사이의 유사도는 퍼지 사전에 의해 측정하였다.
Jain 등은 계층적 이미지 검색 시스템을 제안하고 상표 이미지 데이터베이스에 이를 적용하였다. 이 시스템은 경계선 방향의 히스토그램과 불변 모멘트를 특징 벡터로 사용하는 빠른 1 단계 검색과 가변 템플릿 매칭을 사용하는 세부 매칭 단계라는 2단계 계증구조를 사용하였다.
캐릭터 이미지의 검색을 위해 질의 이미지와 데이터베이스 내의 이미지들에 대해 각각 특징벡터를 추출하여 그 특징 벡터 값을 이용하여 검색한다.
캐릭터 이미지의 경우 색상과 모양 정보가 특징 벡터추출의 주된 정보이기 때문에 본 논문에서는 모양 정보를 나타낼 수 있는 Zernike 모멘트와 색상 정보를 표현할 수 있는 DCT를 이용하여 모양과 컬러 정보가 결합된 새로운 내용기반 이미지 검색 알고리즘을 개발하고, 이를 3, 834개의 캐릭터 이미지에 적용하여 그 성능을 평가하였다.
대상 데이터
본 논문에서 제안한 방법을 검증하기 위해 캐릭터 이미지 866개를 80개 그룹으로 나눈 경우와, 그 이미지를 그룹화 하지 않은 2, 968개의 이미지에 포함 시켜 전체 3, 834개의 실험 이미지로 구성한 경우 이 두 경우에 대해 실험을 하였다. 실험환경은 펜티엄 Ⅲ 450Mhz기종과 윈도우 98의 운영체제 상에서 진행하였으며, Visual C++ 6.
또 이미지 정규화 알고리즘에서의 약점인 회전에 불변하지 않은 특징을 보완해 준다. 본 논문에서는 정규화된 이미지로부터 모양 정보를 추출하기 위한 특징 벡터로는 DC 값인 0차 모멘트 값을 제외한 8차까지의 Zernike 모멘트의 절대값 24개를 사용하였다. 0차 모멘트는 객체의 면적으로서 크기에 불변한 특징량을 얻기 위해 사용된다.
이론/모형
컬러 모델에는 RGB, HSV, YUV, YIQ 및 HMMD등 다양한 모델이 사용되고 있다. 본 논문에서는 색상 정보와 모양 정보를 효율적으로 추출 할 수 있고 애니메이션 검색하기위해 JPEG이나 MPEG 과 같은 압축 표준에서 사용하는 YCbCr 컬러모델을 사용하였다. 이 모델은 휘도 성분인 Y 이미지에 대해 모양 정보를 추출하고, 색차 성분인 Cb, Cr 이미지에서 대해서는 색상 정보를 추출할 수 있게 한다.
정규화 알고리즘은 Zemike모멘트의 가장 취약점인 이미지의 비틀림을 보완해 주는 것으로 정규 모멘트 (Regular moment)를 토대로 이미지 정규화 하는 방법을 이용하였다.이미지 정규화 알고리즘의 특징을 아래의 그림 2 ~ 4에서 살펴보면 크기.
성능/효과
실험결과를 통해, Zernike 모멘트와 DCT계수는 각각 모양 정보와 색상 정보를 기술하는 효과적인 특징 벡터이며, 검색 이미지들의 크기에 불변한 특징벡터를 추출할 수 있는 큰 장점도 가지고 있다. 또 이 방법은 인간의 시각적인 특성을 잘 표현하는 방법으로서 36개의 매우 적은 특징량으로 검색하므로 대용량 데이터베이스와 같은 웹 겸색 시스템과 애니메이션 검색에 적합한 방법을 제시하였다.
표 2 에서 보는 바와 같이 계수가 6개일 때 가장 좋은 검색률을 나타내고 계수의 수가 10이상일 때 검색률이 약간 감소하는 것을 볼 수 있는데 이것은 AC성분이 증가하므로 해서 컬러 이미지 내에 있는 질감 성분을 많이 포함하는 것으로 캐릭터 이미지를 검색하는데 원하지 않는 성분임을 나타낸다. 본 논문에서는 색상 성분 이미지에 대해 각각 6개씩 12개의 특징량을 사용하였다.
후속연구
향후 연구과제로는 모양 정보와 컬러 정보를 결합하는데 사용되는 가중치에 대한 보다 정량적인 분석이 필요하고, 사용자로부터 검색 결과로 제시된 이미지들의 관련성을 피드백 받아 가중치를 재조정하는 방법에 대한 연구가 필요한 것으로 사료된다. 또한 대용량 데이터베이스에서보다 빠른 검색을 위해 캐릭터 이미지들의 자동적인 클러스링 기술이 요구된다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.