본 논문은 한글 및 영문자의 구조적 특징을 이용하여 자연영상에서 문자영역을 검출하는 기법을 제안하였다. 자연 영상에서 에지 특징 값을 추출하고 추출된 특징 값은 필터링을 수행하여 문자의 특징에 맞지 않는 특징 값을 제거하여 문자영역 후보를 선정한다. 선정된 문자영역 후보는 한글 자소 병합 알고리즘으로 하나의 문자로 병합하여 후보 문자영역으로 검출하고, 한글 문자 유형 판별 알고리즘으로 한글 문자영역 여부를 판별함으로서 한글 문자영역을 검출하고, 영문자는 영문자 에지 특징 값을 적용하여 영문자 영역을 검출한다. 실험결과, 복잡한 배경을 갖고 다양한 환경에서 촬영된 영상에서 한글 및 영문자 영역을 효과적으로 검출하였고, 제안한 문자영역 검출 방법은 향상된 검출 결과를 보여 주었다.
본 논문은 한글 및 영문자의 구조적 특징을 이용하여 자연영상에서 문자영역을 검출하는 기법을 제안하였다. 자연 영상에서 에지 특징 값을 추출하고 추출된 특징 값은 필터링을 수행하여 문자의 특징에 맞지 않는 특징 값을 제거하여 문자영역 후보를 선정한다. 선정된 문자영역 후보는 한글 자소 병합 알고리즘으로 하나의 문자로 병합하여 후보 문자영역으로 검출하고, 한글 문자 유형 판별 알고리즘으로 한글 문자영역 여부를 판별함으로서 한글 문자영역을 검출하고, 영문자는 영문자 에지 특징 값을 적용하여 영문자 영역을 검출한다. 실험결과, 복잡한 배경을 갖고 다양한 환경에서 촬영된 영상에서 한글 및 영문자 영역을 효과적으로 검출하였고, 제안한 문자영역 검출 방법은 향상된 검출 결과를 보여 주었다.
We proposes the method to detect the Hangul and English character region from natural image using structural feature of Hangul and English Characters. First, we extract edge features from natural image, Next, if features are not corresponding to the heuristic rule of character features, extracted fe...
We proposes the method to detect the Hangul and English character region from natural image using structural feature of Hangul and English Characters. First, we extract edge features from natural image, Next, if features are not corresponding to the heuristic rule of character features, extracted features filtered out and select candidates of character region. Next, candidates of Hangul character region are merged into one Hangul character using Hangul character merging algorithm. Finally, we detect the final character region by Hangul character class decision algorithm. English character region detected by edge features of English characters. Experimental result, proposed method could detect a character region effectively in images that contains a complex background and various environments. As a result of the performance evaluation, A proposed method showed advanced results about detection of Hangul and English characters region from natural image.
We proposes the method to detect the Hangul and English character region from natural image using structural feature of Hangul and English Characters. First, we extract edge features from natural image, Next, if features are not corresponding to the heuristic rule of character features, extracted features filtered out and select candidates of character region. Next, candidates of Hangul character region are merged into one Hangul character using Hangul character merging algorithm. Finally, we detect the final character region by Hangul character class decision algorithm. English character region detected by edge features of English characters. Experimental result, proposed method could detect a character region effectively in images that contains a complex background and various environments. As a result of the performance evaluation, A proposed method showed advanced results about detection of Hangul and English characters region from natural image.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
기존연구 방법은 자연영상에서 복잡한 배경 속에 문자가 존재하는 경우에는 문자영역을 효율적으로 검출하지 못하는 문제점이 있었다. 따라서 본 논문은 이러한 문제점을 해결하고자 한글문자 자소의 위상적학적 구조 특징과 영문자의 에지 구조 특징을 이용하여 문자영역을 검출하는 방법을 제안한다.
본 논문은 자연영상에 존재하는 한글 문자영역을 검출하기 위해 한글 자소의 위상적인 구조 특징 및 한글 유형 특징을 이용한 방법을 제안하였다. 제안한 문자영역 검출을 위한 실험 영상은 KAIST 인공지능 연구실 사이트에서 제공하는 영상 데이터베이스를 사용하였다[10].
본 논문은 한글 자소의 위상적인 구조 특징 및 영문자 에지 구조 특징을 이용하여 자연영상에서 문자영역을 검출을 위한 기법을 제안하였다. 한글 문자 자소의 위상적인 특징 값으로 한글 자소를 병합하는 한글 자소병합 알고리즘을 제안하였다.
제안 방법
4의 둘째 행의 문자들은 각각의 자소 요소가 모두 연결된 글자체로서 이러한 경우에는 이미 병합된 것으로 한글 자소 병합 알고리즘으로 검출되지 않는다. 따라서 이러한 문자들은 한글 문자 유형 판별 알고리즘을 수행하여 문자영역으로 검출한다.
세 번째 단계는 추출된 에지요소를 레이블화(Labeling)하고 각각의 특징이 문자영역의 특징을 만족하는지 검사하여 문자영역 후보로 선정한다. 마지막 단계로 한글문자는 자소병합과정을 수행하여 하나의 문자영역으로 검출하고 영문자는 문자 특징 검증과정으로 수행하여 영문자영역으로 검출한다.
3와 같은 6가지 형태로 존재하므로 이들 각각의 자소를 하나의 영역으로 병합하는 과정이 필요하다. 본 논문에서는 한글 자소 병합 알고리즘을 이용하여 하나의 문자영역으로 병합하고 병합한 문자영역은 한글 문자 유형 판별 알고리즘을 이용하여 문자 여부를 판별하여 최종적인 한글문자영역을 검출한다. 영문자 영역은 한글문자와 달리 자소 요소가 하나로 구성되므로 이에 상응하는 에지구조 특징을 이용하여 문자영역으로 검출한다.
한글 문자 유형 판별을 위해서 6가지 유형의 한글 문자 유형 판별 알고리즘을 제안하였다. 영문자 영역 검출을 위한 영문자 에지구조의 특징을 제안하고 이를 기반으로 영문자 영역을 검출하였다.
본 논문에서는 한글 자소 병합 알고리즘을 이용하여 하나의 문자영역으로 병합하고 병합한 문자영역은 한글 문자 유형 판별 알고리즘을 이용하여 문자 여부를 판별하여 최종적인 한글문자영역을 검출한다. 영문자 영역은 한글문자와 달리 자소 요소가 하나로 구성되므로 이에 상응하는 에지구조 특징을 이용하여 문자영역으로 검출한다. 한글 자소 병합과 관련된 연구는 주로 문서 영상을 대상으로 한글, 영문, 숫자, 그리고 특수문자 등을 분리하는 방법이 연구되었다[8].
Table 3은 영문자 영역의 에지 특징과 수평 및 수직방향으로 Run의 수와 분포를 제시하였다. 이러한 특징값으로 영문자 영역 여부를 판별하여 영문자 영역을 검출하였다.
한글 자소 병합 알고리즘으로 검출된 후보 문자영역은 한글 문자 유형 판별 알고리즘을 이용하여 한글 문자영역으로 검출하였다. 한글 문자 유형 판별을 위해서 6가지 유형의 한글 문자 유형 판별 알고리즘을 제안하였다. 영문자 영역 검출을 위한 영문자 에지구조의 특징을 제안하고 이를 기반으로 영문자 영역을 검출하였다.
본 논문은 한글 자소의 위상적인 구조 특징 및 영문자 에지 구조 특징을 이용하여 자연영상에서 문자영역을 검출을 위한 기법을 제안하였다. 한글 문자 자소의 위상적인 특징 값으로 한글 자소를 병합하는 한글 자소병합 알고리즘을 제안하였다. 한글 자소 병합 알고리즘으로 검출된 후보 문자영역은 한글 문자 유형 판별 알고리즘을 이용하여 한글 문자영역으로 검출하였다.
대상 데이터
성능 평가는 다양한 환경에서 얻어진 영상을 대상으로 하였고, 성능 평가 결과는 Table 4로 제시하였다. 전반적으로 실험결과, 실외 영상에서 재현률과 정확률이 떨어지는 것을 볼 수 있다.
제안한 문자영역 검출을 위한 실험 영상은 KAIST 인공지능 연구실 사이트에서 제공하는 영상 데이터베이스를 사용하였다[10]. 실험 영상은 실내, 실외 촬영된 영상으로 한글과 영문자를 모두 포함하고 있는 것으로 하였다. 문자영역 검출 성능을 평가하기 위한 방법은 식1의 정확률(Precision)과 식 2의 재현율(Recall)로 평가하였다[11].
본 논문은 자연영상에 존재하는 한글 문자영역을 검출하기 위해 한글 자소의 위상적인 구조 특징 및 한글 유형 특징을 이용한 방법을 제안하였다. 제안한 문자영역 검출을 위한 실험 영상은 KAIST 인공지능 연구실 사이트에서 제공하는 영상 데이터베이스를 사용하였다[10]. 실험 영상은 실내, 실외 촬영된 영상으로 한글과 영문자를 모두 포함하고 있는 것으로 하였다.
이론/모형
한글 문자 자소의 위상적인 특징 값으로 한글 자소를 병합하는 한글 자소병합 알고리즘을 제안하였다. 한글 자소 병합 알고리즘으로 검출된 후보 문자영역은 한글 문자 유형 판별 알고리즘을 이용하여 한글 문자영역으로 검출하였다. 한글 문자 유형 판별을 위해서 6가지 유형의 한글 문자 유형 판별 알고리즘을 제안하였다.
성능/효과
5는 본 논문에서 제안한 방법으로 한글과 영문자가 혼합된 자연영상에서 문자영역을 검출한 결과를 보여준다. 실험결과 재현율은 성능향상 결과를 얻었다. 그러나 정확률은 잡음 요소의 영향으로 낮아지게 되었다.
후속연구
한글과 영문자 일부분이 검출되지 못하였다. 이러한 결과는 한글 병합 알고리즘에서 오른쪽 수직 모임을 체크하는 휴리스틱을 좀 더 일반화하지 못함으로서 발생되었다. Fig.
향후 연구과제는 정확률을 높이기 위해서 문자영역이 갖는 에지 특징을 일반화하여 좀 더 정확한 에지 검출 알고리즘을 개발하는 것이고, 검출된 에지로부터 문자영역을 검출하기 위해서 문자영역 고유의 에지 특징 값을 좀더 일반적이고 다양한 값을 구하는 것이다. 한글과 영문자를 구별하는 추가적인 방법을 찾고, 한글 자소 병합 알고리즘에서 모음 성분의 검증을 위한 추가적인 특징을 적용할 필요가 있다. 한글과 영문자의 검출을 위해서 아라비아 숫자영역에 대한 추가적인 특징을 적용하여 이를 검출할 수 있도록 연구할 필요가 있다.
한글과 영문자를 구별하는 추가적인 방법을 찾고, 한글 자소 병합 알고리즘에서 모음 성분의 검증을 위한 추가적인 특징을 적용할 필요가 있다. 한글과 영문자의 검출을 위해서 아라비아 숫자영역에 대한 추가적인 특징을 적용하여 이를 검출할 수 있도록 연구할 필요가 있다.
향후 연구과제는 정확률을 높이기 위해서 문자영역이 갖는 에지 특징을 일반화하여 좀 더 정확한 에지 검출 알고리즘을 개발하는 것이고, 검출된 에지로부터 문자영역을 검출하기 위해서 문자영역 고유의 에지 특징 값을 좀더 일반적이고 다양한 값을 구하는 것이다. 한글과 영문자를 구별하는 추가적인 방법을 찾고, 한글 자소 병합 알고리즘에서 모음 성분의 검증을 위한 추가적인 특징을 적용할 필요가 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
자연영상에 포함된 문자의 특징은?
자연영상에 포함된 문자영역을 검출하고 인식하는 연구 분야는 시각장애인 보조 시스템[1], 모바일 로봇 내비게이션[2], 번호판 인식[3], 콘텐츠 기반 비디오/이미지 코딩/색인[4] 등이다. 자연영상에 포함된 문자는 다양한 글자체, 크기, 기울기를 갖고, 조명, 그림자 등의 영향으로 글자색이 변하는 특징이 있으므로 자연영상에서 문자영역 검출 방법은 문자 및 문자영역의 다양한 특징을 고려해야 한다[5].
제안된 자연영상에서 문자영역을 검출하는 기법은 어떤 과정인가?
본 논문은 한글 및 영문자의 구조적 특징을 이용하여 자연영상에서 문자영역을 검출하는 기법을 제안하였다. 자연 영상에서 에지 특징 값을 추출하고 추출된 특징 값은 필터링을 수행하여 문자의 특징에 맞지 않는 특징 값을 제거하여 문자영역 후보를 선정한다. 선정된 문자영역 후보는 한글 자소 병합 알고리즘으로 하나의 문자로 병합하여 후보 문자영역으로 검출하고, 한글 문자 유형 판별 알고리즘으로 한글 문자영역 여부를 판별함으로서 한글 문자영역을 검출하고, 영문자는 영문자 에지 특징 값을 적용하여 영문자 영역을 검출한다. 실험결과, 복잡한 배경을 갖고 다양한 환경에서 촬영된 영상에서 한글 및 영문자 영역을 효과적으로 검출하였고, 제안한 문자영역 검출 방법은 향상된 검출 결과를 보여 주었다.
자연영상에 포함된 문자영역을 검출하고 인식하는 연구 분야는 어떻게 되는가?
자연영상에 포함된 문자영역을 검출하고 인식하는 연구 분야는 시각장애인 보조 시스템[1], 모바일 로봇 내비게이션[2], 번호판 인식[3], 콘텐츠 기반 비디오/이미지 코딩/색인[4] 등이다. 자연영상에 포함된 문자는 다양한 글자체, 크기, 기울기를 갖고, 조명, 그림자 등의 영향으로 글자색이 변하는 특징이 있으므로 자연영상에서 문자영역 검출 방법은 문자 및 문자영역의 다양한 특징을 고려해야 한다[5].
참고문헌 (11)
N. Ezaki, M. Bulacu, L. Schomaker: "Text detection from natural scene images: towards a system for visually impaired persons." In: Proc. of the 17th International Conference on Vol. 2, pp.683-686, 2004. DOI: http://dx.doi.org/10.1109/ICPR.2004.1334351
Xiaoqing Liu and Jagath Samarabandu: "An Edge-Based Text Region Extraction Algorithm for Indoor Mobile Robot Navigation." In: International Journal of Signal Processing, Vol.3(4), pp.273-280, 2006. DOI: http://dx.doi.org/10.1109/ICMA.2005.1626635
Kim, S., Kim D., Y. Ryu, Y., and Kim, G: "A Robust License-Plate Extraction Method under Complex Image Conditions," In: Proceedings of International Conference on Pattern Recognition, Vol. 3, pp.216-219, 2002.
Smith, M. A. and T. Kanade: "Video Skimming for Quick Browsing Based on Audio and Image Characterization." Carnegie Mellon University, Technical Report CMU-CS-95-186, 1995.
Chung-Mong Lee, A. Kankanhalli: "Automatic Extraction of Characters in Complex Scene Images." International Journal of Pattern Recognition and Artificial Intelligence, Vol.9(1), pp.67-82, 1995. DOI: http://dx.doi.org/10.1142/S0218001495000043
Park, Jong Cheon. : "Detection Method of Character Region Using Hangul Structure from Natural Image, Department of Computer Engineering," Doctoral Thesis, University of Chungbuk National, 2011.
Oh, In. Gwan.: "Study on the Extraction of Character and Special Character from Hangeul Documents with English," Master's Thesis, Department of Computer Science, University of Kwangwoon, 1993.
C. Yi and Y. Tian : "Text String Detection from Natural Scenes by Structure-based Partition and Grouping." In : IEEE Transactions on Image Proc., PMID:21411405, 2011. DOI: http://dx.doi.org/10.1109/TIP.2011.2126586
KAIST Scene Text Database, http://ai.kaist.ac.kr/home/DB/SceneText
Lucas, S. M., A. Panaretos, L. Sosa, A. Tang, S. Wong and R. Young(2003), "ICDAR 2003 Robust Reading Competition," In 7th International Conference on Document Analysis and Recognition(ICDAR), pp.682-687, 2003.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.