[논문]자연영상에서 컬러분할과 LoG연산특성을 이용한 다중 문자 검출에 관한 연구

신성; 백영현; 문성룡

doi:10.5391/jkiis.2008.18.2.216

[국내논문] 자연영상에서 컬러분할과 LoG연산특성을 이용한 다중 문자 검출에 관한 연구
Multi Characters Detection Using Color Segmentation and LoG operator characteristics in Natural Scene 원문보기

한국지능시스템학회 논문지 = Journal of Korean institute of intelligent systems, v.18 no.2, 2008년, pp.216 - 222

신성 (원광대학교 전자공학과) , 백영현 (원광대학교 전자공학과) , 문성룡 (원광대학교 전자공학과)

초록
AI-Helper

본 논문은 배경복잡성, 조명변화, 무질서한 라인, 문자와 배경색의 유사성 등에 취약한 기존 연구의 단점을 보완하기 위해 컬러분할과 LoG연산자의 폐곡선 에지 특징 및 합성논리모델을 이용한 다중 문자 검출 알고리즘을 제안하였다. 제안된 다중 문자 검출 알고리즘은 특징 검출, 문자형성, 문자검출 단계로 구성된다. 본 논문에서 제안한 새로운 다중 문자 검출 알고리즘은 웨이브렛, 형태학과 허프변환을 이용한 전처리 후 각 컬러영역을 순차적 AND 연산 및 OR연산을 수행함으로써 완전한 문자가 아닌 불완전 문자부분마저도 취합하여 검출률을 높일 수 있는 효율적인 방법임을 확인하였다. 또한 영상의 크기나 해상도, 기울어짐 등에 상관없이 문자영역이 첨가된 자연 영상을 대상으로 하며, 동일 영상에 대하여 기존의 문자 검출 알고리즘과 비교함으로써 제안알고리즘이 검출률면에서 우수함을 확인하였다.

Abstract ▼ AI-Helper

This paper proposed the multi characters detection algorithm using Color segmentation and the closing curve feature of LoG Operator in order to complement the demerit of the existing research which is weak in complexity of background, variety of light and disordered line and similarity of left and background color, etc. The proposed multi characters detection algorithm divided into three parts : The feature detection, characters format and characters detection Parts in order to be possible to apply to image of various feature. After preprocess that the new multi characters detection algorithm that proposed in this paper used wavelet, morphology, hough transform which is the synthesis logical model in order to raise detection rate by acquiring the non-perfection characters as well as the perfection characters with processing OR operation after processing each color area by AND operation sequentially. And the proposal algorithm is simulated with natural images which include natural character area regardless of size, resolution and slant and so on of image. And the proposal algorithm in this paper is confirmed to an excellent detection rate by compared with the conventional detection algorithm in same image.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 논문에서 Coiflet 웨이브렛을 사용한 이유는 그림 2의 기저 함수 특성 곡선에서 보이는 바와 같이 Coiflet, Symlet, Biorthogonal, Daubechies 기저 함수중 Coiflet 기저 함수 특성이 가장 짧은 시간에 국부적으로 에너지가 집중되는 특성을 보여 최고점 및 불연속선 검출에 용이하기 때문이다.
본 논문에서는 각 평면간 순차적 AND 연산과 OR 연산에 의해 불완전한 문자요소들을 하나로 묶어 완전한 문자를 만드는 합성논리모델을 적용하여 텍스트 검출 성능을 높였다. 합성논리모델 적용 후의 결과 영상은 그림 10과 같다
GIA*}* SMA는 각각 명도정보가 배경이 복잡한 영상에 취약한 단점을 보안하기위해 미디언 필터와 하이패스 필터를 사용한다. 본 논문에서는 선행연구와 차별화된 방법으로 자연영상의 문자 정보가 유사한 색상, 채도, 명도를 가지고 있으며, 일정한 두께가 존재한다는데 특성을 착안해 SVCbCr 컬러모델을 이용한 컬러 분할과 LoG 연산자의 폐곡선 에지 특징 및 합성논리모델을 이용한 다중 문자 검출 알고리즘을 제안하고자 한다. 제안된 알고리즘은 영상 크기나 해상도, 기울기 등에 상관없이 문자 영역이 첨가된 자연 영상을 대상으로 검출하며, 기존 문자 검출 알고리즘과 비교하여 우수함을 확인하고자 한다.
본 논문은 배경의 복잡성, 조명의 변화, 무질서한 라인, 문자와 배경색의 유사성 등에 취약한 선행연구의 단점을 보완하기 위한 알고리즘을 제안하였다. 제안한 알고리즘은 자연 영상에 포함된 문자정보는 유사한 색상.
본 논문에서는 선행연구와 차별화된 방법으로 자연영상의 문자 정보가 유사한 색상, 채도, 명도를 가지고 있으며, 일정한 두께가 존재한다는데 특성을 착안해 SVCbCr 컬러모델을 이용한 컬러 분할과 LoG 연산자의 폐곡선 에지 특징 및 합성논리모델을 이용한 다중 문자 검출 알고리즘을 제안하고자 한다. 제안된 알고리즘은 영상 크기나 해상도, 기울기 등에 상관없이 문자 영역이 첨가된 자연 영상을 대상으로 검출하며, 기존 문자 검출 알고리즘과 비교하여 우수함을 확인하고자 한다.

가설 설정

영상은 원영상이고, (b) 영상은 에지검출 영상, (c) 영상은 조건적 팽창을 적용한 영상이다.

제안 방법

채도.명도를 가지고 있으며, 특성상 일정한 두께가 존재한다는데 착안하여 SVCbCr 컬러모델 분할과 LoG연산자 및 합성 논리 모델을 적용하였다. 제안된 다중 문자 검출 알고리즘은 영상의 크기나 해상도에 상관없이 문자 검출이 가능하며, 모의실험 결과 82.
문자 검출 단계에서는 SVCbCr 컬러모델의 특징을 이용하여 검출률을 높이기 위한 합성논리모델(synthesis logical model)을 제안한다. 합성논리모텔은 각 컬러영역을 순차적 AND 연산을 수행한 후 OR연산을 수행함으로써 완전한 문자가 아닌 불완전 문자 부분마저도 취합하여 검출률을 높일 수 있는 효율적인 방법으로 계산식은 식 (6)과 같다.
명도을 가지고 있다. 본 논문에서는 공간컬러모델 중 RGB 컬러모델로부터 HSV 컬러모델의 S (채도, Saturation), V (명도, Value) 값과 YCbCr 컬러모델의 Cb (푸른 정보), Cr(붉은 정보)를 분리하여 사용한다[6丄
제안된 알고리즘은 성능평가를 위해 2003 ICDAR Contest Ima氈s[ll, 12]의 학습영상 258개를 사용하였으며, 동일 영상에 대하여 기존알고리즘[5]과 제안된 알고리즘의 검출률(정확히 검출된 글자 수/영상 내에서의 전체 글자갯수)을 표 1에서 비교하였다. 표 1은 GIA, SMA 문자 검출 알고리즘과 제안된 문자 검출 알고리즘 결과를 크기, 기울기, 색상, 배경, 숫자, 잡음, 폰트, 최종결과 순으로 비교한 것으로 총합은 영상내의 전체 글자 개수이며, 참은 영상 내의 글자 개수 중 정확히 검출된 글자 개수이고, 오류는 잘못 검출된 개수이다.
제안된 알고리즘의 구조는 제 1단계 특징 검출 단계는 SVCbCr 컬러모델 적용 단계와 Coiflet 웨 이브렛 적용 단계로 이루어져 있으며, 제 2단계인 문자형성 단계는 LoG 연산자를 적용하여 에지검출을 수행하는 단계와 허프 변환 적용 단계, 형태학의 조건적 팽창 적용 단계로 이루어져 있다. 마지막으로 제 3단계인 문자 검출 단계는 합성 논리 모델 적용단계와 최소거리 분류기 적용 단계로 구성된다.
두께가 존재하는데 착안한 방식이다.특징 검출단계에서 검출된 파라미터 값에 LoG 연산자를 적용해서 에지를 검출한다. 따라서 폐곡선특징에 의해 텍스트는 폐 (close)영역으로 재구성되며, 식 (3)과 같다[8L

이론/모형

본 논문에서는 사용한 최소거리 분류기는 KNN 분류규칙 P=2인 유클리디안 거리를 사용한다[1 이.

성능/효과

검출률은 영상 내 정확히 검출된 글자 개수를 전체 글자개수로 나눈 값으로 정확도의 비율을 나타내고 있다. GIA의 경우 크기, 기울기, 잡음, 폰트 등에서는 80% 이상의 검출률을 보였으나 복잡하거나 무질서한 라인이 많은 배경에서 61.2%의 낮은 검출률을 보임을 확인하였다. SMA의 경우는 영상의 특성에 구애받지 않고 고른 검출률을 보였으나 전체적으로 낮은 검출 성능을 보인다.
명도를 가지고 있으며, 특성상 일정한 두께가 존재한다는데 착안하여 SVCbCr 컬러모델 분할과 LoG연산자 및 합성 논리 모델을 적용하였다. 제안된 다중 문자 검출 알고리즘은 영상의 크기나 해상도에 상관없이 문자 검출이 가능하며, 모의실험 결과 82.7%의 정확도를 보임으로써 기존 알고리즘 GIA에 비해 3.4%, SMA에 비해 10.1% 향상된 우수한 결과를 보임을 확인하였다.
제안된 텍스트 검출 알고리즘은 모든 특성에 대해 전반적으로 높은 검출률을 보였으며 특히 문자나 배경의 색상변화에 대해 검출률이 90.6%로 가장 강인함을 확인하였다. 검출률이 가장 낮은 특성은 75.
7%의 성능을 보인 배경 항목으로 향후 문자와 유사한 배경의 분류 측면에서 알고리즘 차원의 개선이 이루어져야 할 것으로 사료된다. 최종 실험 결과 GIAS 경우 79.3%, SMA의 경우 72.6%의 정확도를 얻은 반면 제안 알고리즘은 82.7%로 GIA에 비해 3.4%, SMA에 비해 10.1% 향상된 우수한 결과를 확인하였다.

후속연구

6%로 가장 강인함을 확인하였다. 검출률이 가장 낮은 특성은 75.7%의 성능을 보인 배경 항목으로 향후 문자와 유사한 배경의 분류 측면에서 알고리즘 차원의 개선이 이루어져야 할 것으로 사료된다. 최종 실험 결과 GIAS 경우 79.
향후 분류 성능을 높일 수 있는 분류기 설계 및 처리 속도개선 측면에서 보완이 이루어져야 하며, 실시간 구현시 문자인식의 전처리 과정으로서 지능형 보행안내 및 자동주행시스템 등과 같은 다양한 분야에 활용 및 응용이 사료된다.

참고문헌 (12)

Yu Zhong, Kalle Karu, Anil K. Jain, "Locating Text in Complex Images", Pattern Recognition, Vol. 28, No. 10, pp. 1523-1535, 1995

상세보기
Lixu Gu, Toyahisa Kaneko, "Robust extraction of Characters from color scene Image Using Mathematical morphology", Proc. of 7th Int. Conf. on Pattern Recognition, Vol. 2, pp. 1002-1004, 1998
P. K. Kim, "Automatic Text Location in Complex Color Images using Local Color Quantization", TENCON 99. Proc. of the IEEE Region 10 Conference, Vol. 1, pp. 629-632, 1999
K. C. Kim, "Scene Text Extraction in Natural Scene Images using Hierarchical Feature Combining and Verification", Proc. of 17th Int. Conf. on Pattern Recognition, Vol. 4, pp. 1051-4651, 2004
J. S. Kim, "Text Locating from Natural Scene Images Using Image Intensities", Proc. of the 2005 Eight Int. Conf. on Document Analysis and Recognition, Vol. 5, pp. 1520-5263, 2005
R. Crane, "A simplified approach to Image Processing". Prentice-Hall, 1997
C. S. Burrus, and R. A. Gopinath, and H. Guo, "Introduction to Wavelets and Wavelet Transforms", Prentice-Hall, Inc., 1998
Ulupinar, F. and Medioni, G., "Refining edge detected by a LoG operator". IEEE Proc. Computer Vision and Pattern Recognition, pp. 202-207, 1998
D. F. Rogers, "Procedural elements for computer graphics", McGraw-Hill, 1985
R.Gonzalez and R.Woods, "Digital Image Process ing".Addison-Wesley Publishing Company, 1992
Robust Reading Competition Database, Retrived October 20, 2004 from http://algoval.essex.ac.uk/icdar/RobustWord.html
S. M. Lucas, A. Panaretos, L. Sosa, A. Tang, S. Wong and R.Young, "ICDAR 2003 Robust Reading Competition", International Conference on Document Analysis and Recognition(ICDAR), Vol. 2, pp. 682-687, 2003

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증