[국내논문]자연영상에서 컬러분할과 LoG연산특성을 이용한 다중 문자 검출에 관한 연구 Multi Characters Detection Using Color Segmentation and LoG operator characteristics in Natural Scene원문보기
본 논문은 배경복잡성, 조명변화, 무질서한 라인, 문자와 배경색의 유사성 등에 취약한 기존 연구의 단점을 보완하기 위해 컬러분할과 LoG연산자의 폐곡선에지 특징 및 합성논리모델을 이용한 다중 문자 검출 알고리즘을 제안하였다. 제안된 다중 문자 검출 알고리즘은 특징 검출, 문자형성, 문자검출 단계로 구성된다. 본 논문에서 제안한 새로운 다중 문자 검출 알고리즘은 웨이브렛, 형태학과 허프변환을 이용한 전처리 후 각 컬러영역을 순차적 AND 연산 및 OR연산을 수행함으로써 완전한 문자가 아닌 불완전 문자부분마저도 취합하여 검출률을 높일 수 있는 효율적인 방법임을 확인하였다. 또한 영상의 크기나 해상도, 기울어짐 등에 상관없이 문자영역이 첨가된 자연 영상을 대상으로 하며, 동일 영상에 대하여 기존의 문자 검출 알고리즘과 비교함으로써 제안알고리즘이 검출률면에서 우수함을 확인하였다.
본 논문은 배경복잡성, 조명변화, 무질서한 라인, 문자와 배경색의 유사성 등에 취약한 기존 연구의 단점을 보완하기 위해 컬러분할과 LoG연산자의 폐곡선 에지 특징 및 합성논리모델을 이용한 다중 문자 검출 알고리즘을 제안하였다. 제안된 다중 문자 검출 알고리즘은 특징 검출, 문자형성, 문자검출 단계로 구성된다. 본 논문에서 제안한 새로운 다중 문자 검출 알고리즘은 웨이브렛, 형태학과 허프변환을 이용한 전처리 후 각 컬러영역을 순차적 AND 연산 및 OR연산을 수행함으로써 완전한 문자가 아닌 불완전 문자부분마저도 취합하여 검출률을 높일 수 있는 효율적인 방법임을 확인하였다. 또한 영상의 크기나 해상도, 기울어짐 등에 상관없이 문자영역이 첨가된 자연 영상을 대상으로 하며, 동일 영상에 대하여 기존의 문자 검출 알고리즘과 비교함으로써 제안알고리즘이 검출률면에서 우수함을 확인하였다.
This paper proposed the multi characters detection algorithm using Color segmentation and the closing curve feature of LoG Operator in order to complement the demerit of the existing research which is weak in complexity of background, variety of light and disordered line and similarity of left and b...
This paper proposed the multi characters detection algorithm using Color segmentation and the closing curve feature of LoG Operator in order to complement the demerit of the existing research which is weak in complexity of background, variety of light and disordered line and similarity of left and background color, etc. The proposed multi characters detection algorithm divided into three parts : The feature detection, characters format and characters detection Parts in order to be possible to apply to image of various feature. After preprocess that the new multi characters detection algorithm that proposed in this paper used wavelet, morphology, hough transform which is the synthesis logical model in order to raise detection rate by acquiring the non-perfection characters as well as the perfection characters with processing OR operation after processing each color area by AND operation sequentially. And the proposal algorithm is simulated with natural images which include natural character area regardless of size, resolution and slant and so on of image. And the proposal algorithm in this paper is confirmed to an excellent detection rate by compared with the conventional detection algorithm in same image.
This paper proposed the multi characters detection algorithm using Color segmentation and the closing curve feature of LoG Operator in order to complement the demerit of the existing research which is weak in complexity of background, variety of light and disordered line and similarity of left and background color, etc. The proposed multi characters detection algorithm divided into three parts : The feature detection, characters format and characters detection Parts in order to be possible to apply to image of various feature. After preprocess that the new multi characters detection algorithm that proposed in this paper used wavelet, morphology, hough transform which is the synthesis logical model in order to raise detection rate by acquiring the non-perfection characters as well as the perfection characters with processing OR operation after processing each color area by AND operation sequentially. And the proposal algorithm is simulated with natural images which include natural character area regardless of size, resolution and slant and so on of image. And the proposal algorithm in this paper is confirmed to an excellent detection rate by compared with the conventional detection algorithm in same image.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서 Coiflet 웨이브렛을 사용한 이유는 그림 2의 기저 함수 특성 곡선에서 보이는 바와 같이 Coiflet, Symlet, Biorthogonal, Daubechies 기저 함수중 Coiflet 기저 함수 특성이 가장 짧은 시간에 국부적으로 에너지가 집중되는 특성을 보여 최고점 및 불연속선 검출에 용이하기 때문이다.
본 논문에서는 각 평면간 순차적 AND 연산과 OR 연산에 의해 불완전한 문자요소들을 하나로 묶어 완전한 문자를 만드는 합성논리모델을 적용하여 텍스트 검출 성능을 높였다. 합성논리모델 적용 후의 결과 영상은 그림 10과 같다
GIA*}* SMA는 각각 명도정보가 배경이 복잡한 영상에 취약한 단점을 보안하기위해 미디언 필터와 하이패스 필터를 사용한다. 본 논문에서는 선행연구와 차별화된 방법으로 자연영상의 문자 정보가 유사한 색상, 채도, 명도를 가지고 있으며, 일정한 두께가 존재한다는데 특성을 착안해 SVCbCr 컬러모델을 이용한 컬러 분할과 LoG 연산자의 폐곡선 에지 특징 및 합성논리모델을 이용한 다중 문자 검출 알고리즘을 제안하고자 한다. 제안된 알고리즘은 영상 크기나 해상도, 기울기 등에 상관없이 문자 영역이 첨가된 자연 영상을 대상으로 검출하며, 기존 문자 검출 알고리즘과 비교하여 우수함을 확인하고자 한다.
본 논문은 배경의 복잡성, 조명의 변화, 무질서한 라인, 문자와 배경색의 유사성 등에 취약한 선행연구의 단점을 보완하기 위한 알고리즘을 제안하였다. 제안한 알고리즘은 자연 영상에 포함된 문자정보는 유사한 색상.
본 논문에서는 선행연구와 차별화된 방법으로 자연영상의 문자 정보가 유사한 색상, 채도, 명도를 가지고 있으며, 일정한 두께가 존재한다는데 특성을 착안해 SVCbCr 컬러모델을 이용한 컬러 분할과 LoG 연산자의 폐곡선 에지 특징 및 합성논리모델을 이용한 다중 문자 검출 알고리즘을 제안하고자 한다. 제안된 알고리즘은 영상 크기나 해상도, 기울기 등에 상관없이 문자 영역이 첨가된 자연 영상을 대상으로 검출하며, 기존 문자 검출 알고리즘과 비교하여 우수함을 확인하고자 한다.
채도.명도를 가지고 있으며, 특성상 일정한 두께가 존재한다는데 착안하여 SVCbCr 컬러모델 분할과 LoG연산자 및 합성 논리 모델을 적용하였다. 제안된 다중 문자 검출 알고리즘은 영상의 크기나 해상도에 상관없이 문자 검출이 가능하며, 모의실험 결과 82.
문자 검출 단계에서는 SVCbCr 컬러모델의 특징을 이용하여 검출률을 높이기 위한 합성논리모델(synthesis logical model)을 제안한다. 합성논리모텔은 각 컬러영역을 순차적 AND 연산을 수행한 후 OR연산을 수행함으로써 완전한 문자가 아닌 불완전 문자 부분마저도 취합하여 검출률을 높일 수 있는 효율적인 방법으로 계산식은 식 (6)과 같다.
명도을 가지고 있다. 본 논문에서는 공간컬러모델 중 RGB 컬러모델로부터 HSV 컬러모델의 S (채도, Saturation), V (명도, Value) 값과 YCbCr 컬러모델의 Cb (푸른 정보), Cr(붉은 정보)를 분리하여 사용한다[6丄
제안된 알고리즘은 성능평가를 위해 2003 ICDAR Contest Ima氈s[ll, 12]의 학습영상 258개를 사용하였으며, 동일 영상에 대하여 기존알고리즘[5]과 제안된 알고리즘의 검출률(정확히 검출된 글자 수/영상 내에서의 전체 글자갯수)을 표 1에서 비교하였다. 표 1은 GIA, SMA 문자 검출 알고리즘과 제안된 문자 검출 알고리즘 결과를 크기, 기울기, 색상, 배경, 숫자, 잡음, 폰트, 최종결과 순으로 비교한 것으로 총합은 영상내의 전체 글자 개수이며, 참은 영상 내의 글자 개수 중 정확히 검출된 글자 개수이고, 오류는 잘못 검출된 개수이다.
제안된 알고리즘의 구조는 제 1단계 특징 검출 단계는 SVCbCr 컬러모델 적용 단계와 Coiflet 웨 이브렛 적용 단계로 이루어져 있으며, 제 2단계인 문자형성 단계는 LoG 연산자를 적용하여 에지검출을 수행하는 단계와 허프 변환 적용 단계, 형태학의 조건적 팽창 적용 단계로 이루어져 있다. 마지막으로 제 3단계인 문자 검출 단계는 합성 논리 모델 적용단계와 최소거리 분류기 적용 단계로 구성된다.
본 논문에서는 사용한 최소거리 분류기는 KNN 분류규칙 P=2인 유클리디안 거리를 사용한다[1 이.
성능/효과
검출률은 영상 내 정확히 검출된 글자 개수를 전체 글자개수로 나눈 값으로 정확도의 비율을 나타내고 있다. GIA의 경우 크기, 기울기, 잡음, 폰트 등에서는 80% 이상의 검출률을 보였으나 복잡하거나 무질서한 라인이 많은 배경에서 61.2%의 낮은 검출률을 보임을 확인하였다. SMA의 경우는 영상의 특성에 구애받지 않고 고른 검출률을 보였으나 전체적으로 낮은 검출 성능을 보인다.
명도를 가지고 있으며, 특성상 일정한 두께가 존재한다는데 착안하여 SVCbCr 컬러모델 분할과 LoG연산자 및 합성 논리 모델을 적용하였다. 제안된 다중 문자 검출 알고리즘은 영상의 크기나 해상도에 상관없이 문자 검출이 가능하며, 모의실험 결과 82.7%의 정확도를 보임으로써 기존 알고리즘 GIA에 비해 3.4%, SMA에 비해 10.1% 향상된 우수한 결과를 보임을 확인하였다.
제안된 텍스트 검출 알고리즘은 모든 특성에 대해 전반적으로 높은 검출률을 보였으며 특히 문자나 배경의 색상변화에 대해 검출률이 90.6%로 가장 강인함을 확인하였다. 검출률이 가장 낮은 특성은 75.
7%의 성능을 보인 배경 항목으로 향후 문자와 유사한 배경의 분류 측면에서 알고리즘 차원의 개선이 이루어져야 할 것으로 사료된다. 최종 실험 결과 GIAS 경우 79.3%, SMA의 경우 72.6%의 정확도를 얻은 반면 제안 알고리즘은 82.7%로 GIA에 비해 3.4%, SMA에 비해 10.1% 향상된 우수한 결과를 확인하였다.
후속연구
6%로 가장 강인함을 확인하였다. 검출률이 가장 낮은 특성은 75.7%의 성능을 보인 배경 항목으로 향후 문자와 유사한 배경의 분류 측면에서 알고리즘 차원의 개선이 이루어져야 할 것으로 사료된다. 최종 실험 결과 GIAS 경우 79.
향후 분류 성능을 높일 수 있는 분류기 설계 및 처리 속도개선 측면에서 보완이 이루어져야 하며, 실시간 구현시 문자인식의 전처리 과정으로서 지능형 보행안내 및 자동주행시스템 등과 같은 다양한 분야에 활용 및 응용이 사료된다.
참고문헌 (12)
Yu Zhong, Kalle Karu, Anil K. Jain, "Locating Text in Complex Images", Pattern Recognition, Vol. 28, No. 10, pp. 1523-1535, 1995
Lixu Gu, Toyahisa Kaneko, "Robust extraction of Characters from color scene Image Using Mathematical morphology", Proc. of 7th Int. Conf. on Pattern Recognition, Vol. 2, pp. 1002-1004, 1998
P. K. Kim, "Automatic Text Location in Complex Color Images using Local Color Quantization", TENCON 99. Proc. of the IEEE Region 10 Conference, Vol. 1, pp. 629-632, 1999
K. C. Kim, "Scene Text Extraction in Natural Scene Images using Hierarchical Feature Combining and Verification", Proc. of 17th Int. Conf. on Pattern Recognition, Vol. 4, pp. 1051-4651, 2004
J. S. Kim, "Text Locating from Natural Scene Images Using Image Intensities", Proc. of the 2005 Eight Int. Conf. on Document Analysis and Recognition, Vol. 5, pp. 1520-5263, 2005
R. Crane, "A simplified approach to Image Processing". Prentice-Hall, 1997
C. S. Burrus, and R. A. Gopinath, and H. Guo, "Introduction to Wavelets and Wavelet Transforms", Prentice-Hall, Inc., 1998
Ulupinar, F. and Medioni, G., "Refining edge detected by a LoG operator". IEEE Proc. Computer Vision and Pattern Recognition, pp. 202-207, 1998
D. F. Rogers, "Procedural elements for computer graphics", McGraw-Hill, 1985
R.Gonzalez and R.Woods, "Digital Image Process ing".Addison-Wesley Publishing Company, 1992
Robust Reading Competition Database, Retrived October 20, 2004 from http://algoval.essex.ac.uk/icdar/RobustWord.html
S. M. Lucas, A. Panaretos, L. Sosa, A. Tang, S. Wong and R.Young, "ICDAR 2003 Robust Reading Competition", International Conference on Document Analysis and Recognition(ICDAR), Vol. 2, pp. 682-687, 2003
※ AI-Helper는 부적절한 답변을 할 수 있습니다.