본 논문에서는 모바일 폰에서 오프라인 필기체 과분할 인식의 후처리 방법에 관하여 논하였다. 제안된 방법은 조합 행렬 생성, 문자 조합 필터링, 문자 유사도 측정으로 구성된다. 조합 행렬 생성 과정은 각각의 조각의 인식 결과로부터 생성가능한 모든 조합 행렬을 계산하는 부분이며 조합 행렬을 그래프로 구성하게 된다. 문자 조합 필터링 과정은 그래프의 노드들과 단어 사전을 비교하여 불필요한 노드를 삭제하는 과정이며 문자 유사도 측정과정은 단어 사전의 각각의 단어들과 Levenshtein 거리(distance)를 계산하여 최적의 후처리 결과를 추출하게 된다. 제안된 방법의 인식률은 85.8%의 정확도를 보였다.
본 논문에서는 모바일 폰에서 오프라인 필기체 과분할 인식의 후처리 방법에 관하여 논하였다. 제안된 방법은 조합 행렬 생성, 문자 조합 필터링, 문자 유사도 측정으로 구성된다. 조합 행렬 생성 과정은 각각의 조각의 인식 결과로부터 생성가능한 모든 조합 행렬을 계산하는 부분이며 조합 행렬을 그래프로 구성하게 된다. 문자 조합 필터링 과정은 그래프의 노드들과 단어 사전을 비교하여 불필요한 노드를 삭제하는 과정이며 문자 유사도 측정과정은 단어 사전의 각각의 단어들과 Levenshtein 거리(distance)를 계산하여 최적의 후처리 결과를 추출하게 된다. 제안된 방법의 인식률은 85.8%의 정확도를 보였다.
In this paper, we propose a method for the postprocessing of cursive script recognition in Wine Label Images. The proposed method mainly consists of three steps: combination matrix generation, character combination filtering, string matching. Firstly, the combination matrix generation step detects a...
In this paper, we propose a method for the postprocessing of cursive script recognition in Wine Label Images. The proposed method mainly consists of three steps: combination matrix generation, character combination filtering, string matching. Firstly, the combination matrix generation step detects all possible combinations from a recognition result for each of the pieces. Secondly, the unnecessary information in the combination matrix is removed by comparing with bigram of word in the lexicon. Finally, string matching step decides the identity of result as a best matched word in the lexicon based on the levenshtein distance. An experimental result shows that the recognition accuracy is 85.8%.
In this paper, we propose a method for the postprocessing of cursive script recognition in Wine Label Images. The proposed method mainly consists of three steps: combination matrix generation, character combination filtering, string matching. Firstly, the combination matrix generation step detects all possible combinations from a recognition result for each of the pieces. Secondly, the unnecessary information in the combination matrix is removed by comparing with bigram of word in the lexicon. Finally, string matching step decides the identity of result as a best matched word in the lexicon based on the levenshtein distance. An experimental result shows that the recognition accuracy is 85.8%.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이러한 하드웨어적 기술의 발전을 바탕으로 모바일 기기 사용자에게 다양한 정보를 제공하기위한 목적으로 고해상도 카메라를 장착한 모바일 기기를 사용한 다양한 응용분야의 연구가 진행되고 있다. [1-3], 본 논문에서는 와인 영상내의 필기문자를 인식함으로써 사용자에게 다양한 형태의 정보를 제공하기 위한 응용을 논하고자 한다. 와인 라벨은 영상 내의 필기문자는 생산지별로 다양한 언어' 형태, 글자체를 가지고있으며 다양한 배경 및 색상으로 구성된다.
본 논문에서는 모바일 환경에서 필기체 인식의 성능향상을 위하여 그래프, 문자 집합(Character set), Levenshtein 거리를 이용한 복합적 후처리 방법을 제안한다. 3장의 1절에서 과분할 인식에 대하여 간략하게 설명하고 2절에서는 그래프를 이용한 인식결과 필터링 방법에 대하여 설명한다.
하지만 많은 양의 잡음 및 분할이 발생하면 처리 결과의 신뢰도가 떨어지게 된다. 본 논문에서는 이러한 단점을 보완하고자 LD의 연산을 분석하여인식 결과에서 잡음 영역과 문자영역을 분리하고 문자영역에 대하여 문자열거리를 계산하였고 비교 대상 문자와의 유사도를 측정하게 된다. LD algorithme 입력문자와 비교문자의 변환행렬을 계산하고 최소 변환 거리를 탐색하며 삽입, 삭제, 대치, 변화 없음으로 구성된연산을 수행한다.
본 논문예서는 모바일 폰에서 오프라인 필기체 과분할 인식의 후처리 방법에 관하여 논하였다. 과분할 인식방법의 인식 결과를 바탕으로 그래프를 구축하고 비교대상 문자열과 bigian을 비교하여 불필요한 노드의 제거를 수* 행하였다 또한 Levenshtein 거리의 교정 거리를 계산하고 교정 연산을 분석하여 잡음영역과 문자영역을 구분하여 문자 영역예서만 거리를 계산함으로 잡음의 영향을 제거하여 오인식을 개선하기 위한 후처리를 제* 안하였다 평가 척도로는 후보 문자조합의 축소율, 오인식된 경우를 올바르게 교정한 정도, 후처리 전과 후의 인식률을 측정하였고 문자 단위 인식률이 39.
제안 방법
문자 조각 수에 따른 조합 문자열의 수가 증가하는문제를 해결하기 위하여 인식 결과를 그래프로 구성하였으며 인식 결과와 비교대상문자에 포함된 문자들을비교하여 노드의 삭제를 수행한다. 과분할 인식 결과예는 정확한 문자의 구성을 예측할 수 없으므로 불필요한 정보가 포함되게 된다.
실험은 모바일 폰에서 수행하였으며 필기체가 존재하는 18개의 와인 라벨을 대상으로 3명이 각기 라벨 당 3 회씩 반복 수행하였다. 실험에 사용된 총 영상 수는 필기체 162장이며 문자수는 필기체 1.
대상 데이터
647자이다. 실험에 사용된 모바일 폰은 삼성 SPH-M49CXT옵니아)를 사용하였다. 실험에 대한 평가 척도로는 후보 문자조합의 축소율, 오인식된 경우를 올바르게 교정한 정도(식 (2)), 후처리전과 후의 인식률(식 (3))로 하였다.
반복 수행하였다. 실험에 사용된 총 영상 수는 필기체 162장이며 문자수는 필기체 1.647자이다. 실험에 사용된 모바일 폰은 삼성 SPH-M49CXT옵니아)를 사용하였다.
성능/효과
인식의 후처리 방법에 관하여 논하였다. 과분할 인식방법의 인식 결과를 바탕으로 그래프를 구축하고 비교대상 문자열과 bigian을 비교하여 불필요한 노드의 제거를 수* 행하였다 또한 Levenshtein 거리의 교정 거리를 계산하고 교정 연산을 분석하여 잡음영역과 문자영역을 구분하여 문자 영역예서만 거리를 계산함으로 잡음의 영향을 제거하여 오인식을 개선하기 위한 후처리를 제* 안하였다 평가 척도로는 후보 문자조합의 축소율, 오인식된 경우를 올바르게 교정한 정도, 후처리 전과 후의 인식률을 측정하였고 문자 단위 인식률이 39.5%, 라벨 단위 인식률 35.0%의 인심 성능 향상되어 제안한 방법이 효과적임을 보였다. 하지만 문자열이 유사한 경우, 정답의 수가 작은 경우에는 정확한 교정을 수행할 수없었으며 이러한 문제점도 함께 대처할 수 있는 후처리방법에 대한 연구도 수행되어야 할 것이다.
여기서 라벨단위 인식률은 라벨명을 정확히 인식하였을경우이며 후처리 젼 인식률은 잡음이 포함되어 있는 영상이 대부분이므로 잡음이 포함되어 있더라도 인식 결과에 정답이 모두 존재할 경우 인식 성공으로 하였다. 그림 7은 과분할 방식을 이용한 查기체 인식 방법의 결과에 대한 예이다.
실험에 대한 평가 척도로는 후보 문자조합의 축소율, 오인식된 경우를 올바르게 교정한 정도(식 (2)), 후처리전과 후의 인식률(식 (3))로 하였다. 표 2는 인식결과 필터링을 이용한 문자조합의 축소율로 98.5% 문자조합을 필터링하였고 결과적으로 후처리 과정에서 발생하는 시간 증가를 최소화하였다.
후속연구
0%의 인심 성능 향상되어 제안한 방법이 효과적임을 보였다. 하지만 문자열이 유사한 경우, 정답의 수가 작은 경우에는 정확한 교정을 수행할 수없었으며 이러한 문제점도 함께 대처할 수 있는 후처리방법에 대한 연구도 수행되어야 할 것이다.
참고문헌 (9)
I. Haritaoglu, "Scene text extraction and translation for handheld devices," Proc. the IEEE Conference on Computer Vision and Pattern Recognition, vol.2, pp.408-413, 2001.
C. Thillou, B. Gosselin, "Natural scene text understanding," Vision Systems, Segmentation and Pattern Recognition, Ch.16, pp.307-333, 2007.
J. Zhang, A. Hanneman, A. Hanneman, J. Yang, A. Waibel, "A robust approach for recognition of text embedded in natural scenes," International Conference on Pattern Recognition, vol.3, pp.204-207, 2002.
C. Li, X. Ding, and Y. Wu, "Automatic text location in natural scene images," Proc. International Conference on Document Analysis and Recognition, pp.1069-1073, 2001.
I. S. Oh, C. Y.Suen, C. Y.Suen, "istance Features for Optical Character Recognition," Journal of KIISE : Software and Applications, vol.25, no.7, pp.1028-1043, 1998. (in Korean)
M. Shridhar, A. Badreldin, "A high-accuracy syntactic recognition algorithm for handwritten numerals," IEEE Transactions on Systems, Man, and Cybernetics, vol.SMC-15, no.1, pp.152-158. 1985.
T. Pavlidis, F. Ali, "Computer recognition of handwritten numerals by polygonal approximations," IEEE Transactions on Systems, Man, and Cybernetics, vol.SMC-5, pp.610-614, 1975.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.