$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

간판영상에서 한글 인식 성능향상을 위한 가중치 기반 음소 단위 분할 교정
Weighted Disassemble-based Correction Method to Improve Recognition Rates of Korean Text in Signboard Images 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.12 no.2, 2012년, pp.105 - 115  

이명훈 (코난테크놀로지 미디어기술지원) ,  양형정 (전남대학교 전자 컴퓨터 공학부) ,  김수형 (전남대학교 전자 컴퓨터 공학부) ,  이귀상 (전남대학교 전자 컴퓨터 공학부) ,  김선희

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 휴대폰 카메라를 통해 간판영상의 한글문자를 인식한 후 오인식 된 결과를 교정하는 방법으로 인식 후보를 음소단위 분할하고 연산 가중치를 적용한 weighted Disassemble Levenshtein Distance(wDLD)를 제안한다. 제안된 방법은 인식된 문자열을 음소 단위로 분할한 후 입력 형태의 거리값을 산출하여, 가장 유사한 상호명을 데이터베이스에서 검출 한다. 제안된 방법의 효율성을 검증하기 위해, 전국의 상호명 중 중복되는 상호명을 제거한 130만개의 상호명을 이용하여 데이터베이스 사전을 구축하였다. 또한 대표적인 문자열 비교 알고리즘인 Levenshtein Distance와 음소를 분할하여 적용한 Disassemble Levenshtein Distance 방법, 그리고 본 논문에서 제안한 인식 후보의 음소 단위 분할 방법과 연산 가중치를 적용한 weighted Disassemble Levenshtein Distance의 교정율을 비교 분석 하였다. 그 결과 제안된 weighted Disassemble Levenshtein Distance(wDLD)은 Levenshtein Distance와 Disassemble Levenshtein Distance방법에 비해 각각 평균 29.85%와 6%의 인식률의 향상을 보였다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose a correction method using phoneme unit segmentation to solve misrecognition of Korean Texts in signboard images using weighted Disassemble Levenshtein Distance. The proposed method calculates distances of recognized texts which are segmented into phoneme units and detects t...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 한글인식은 영문인식에 비해 분류 개수가 상대적으로 많아 인식에 대한 어려움이 있다. 따라서 본 논문에서는 인식 성능 향상을 위해 2667자 중 실제 간판 상호명에서 사용되는 글자로 분류 개수를 줄였다. 전국 상호명 데이터베이스를 분석한 결과 실제 사용된 글자의 개수는 1920자 이며, 본 논문에서는 이중 사용 빈도가 낮은 글자를 제외한 총 사용빈도 98%에 해당되는 808자를 실험에 이용하였다.
  • 본 논문에서는 간판 인식 및 번역 시스템에서 간판영상으로부터 한글의 개별문자 인식률 향상을 위한 인식 후보 음소 단위 분할 방법과 연산 가중치를 적용한 오인식 교정 후 처리 방법을 제안한다. 제안한 방법은 휴대폰 카메라를 이용하여 촬영한 간판 영상을 문자인식기에서 인식한 후 오인식 된 문자를 교정함으로써 기존의 방법보다 인식률을 향상 시킬 수 있다.
  • 본 논문에서는 간판이라는 제한된 영역에서의 텍스트를 인식하기 위하여 전국 상호명 데이터베이스를 구축하였다. 전체 400여만개의 상호명 데이터베이스에서 중복되거나, 혹은 영문자, 숫자가 포함된 데이터를 제외한 130여만개의 상호명 데이터베이스를 구축하였다.
  • 입력된 R로부터 가장 유사한 상호명을 찾기 위해 상호명 데이터베이스를 검색하고 검색된 결과를 D라고 정의 한다. 본 논문에서는 입력 문자열과 가장 유사한 문자열을 찾기 위해 검색 된 결과 D와 입력 문자열 R 사이의 거리 값을 측정한다. 데이터베이스 검색 시, 입력 문자열 R과 같은 길이의 문자열만을 검색하게 된다면, 문자 분할 과정에서 발생하는 분할 실패나 과분할된 입력 문자열의 경우 검색된 결과 D에 정답 문자열이 포함되지 않은 문제점이 발생하게 된다.
  • 본 논문에서는 한글의 특성을 고려하면서 연산 비용을 최소로 하기 위해 연산 가중치를 적용하고 인식 후보 순위에 음소 단위 분할을 적용한 향상된 wDLD (weighted Disassemble Levenshtein Distance)를 제안한다. 한글은 영문과는 다르게 초성, 중성, 종성의 조합으로 이루어져 있으며, 각 음소별로 유사한 형태가 존재한다.
  • 본 논문에서는 휴대폰 카메라 기반 간판영상 텍스트 인식 시스템의 인식결과로부터 인식 후보의 음소 단위 분할을 적용하여 간판 상호명 데이터베이스의 후보군들과의 거리 값을 산출하고 가장 유사한 상호명으로 교정하는 방법을 제안하였다. 후보군 데이터베이스 구축을 위해 130만 여개의 전국 상호명 데이터베이스를 구축하였다.
  • 본 논문에서는 휴대폰 카메라를 이용하여 촬영된 간판 영상 인식에서 발생하는 오인식 문제를 해결하기 위해 오인식을 내포하고 있는 인식결과를 교정하는 weighted Disassemble Levenshtein Distance 후처리 방법을 제안한다.

가설 설정

  • 본 논문에서 제안된 wDLD의 경우, 하나의 분할된 음절의 음소는 다른 후보 음절의 분할된 음소와 중복 되는 경우가 발생한다. 따라서 wDLD에서는 후보순위가 높고 중복 횟수가 많을수록 신뢰도가 높다고 가정하여 대치 연산비용을 조절한다. 즉, 후보순위가 높고 중복 횟수가 많을수록 연산 비용은 적게 소요된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
휴대폰을 이용한 간판영상 문자 인식 시스템을 구성하는 세 단계는 무엇인가? 휴대폰을 이용한 간판영상 문자 인식 시스템은 그림 1에서와 같이 3단계로 구성된다. 첫 번째 단계로는 입력받은 간판영상에서 텍스트 영역을 찾고, 텍스트 영역에서 글자영역과 배경영역을 이진화 한다. 두 번째는 이진화된 문자영상을 각각의 문자 영상으로 분리하고 촬영 각도에 의해 왜곡된 문자영상을 보정하여 개별 문자 인식기에 입력하게 된다. 개별 문자 인식기에서는 신경망을 통해 분리된 글자 영상을 한 글자씩 인식하게 된다. 세 번째 단계는 인식된 문자를 후처리하여 사용자에게 정보를 제공하게 된다. [그림 2]는 개별 문자 인식기로부터 인식된 입력 값을 보여준다.
간판의 특징은 무엇인가? 길거리에서 필요한 정보를 얻기 위해 가장 먼저 찾고 흔히 볼 수 있는 매체로 간판을 들 수 있다. 간판의 특징은 직관적인 시각 정보를 가장 많이 포함하고 있다는 것이다. 간판에서 정보를 획득하기 위한 방법으로는 스마트폰 및 PDA 등의 고해상도 컬러 카메라를 장착한 모바일 단말기를 사용하는 것이다.
자연 영상에서의 문자인식이 어려움을 겪는 이유는 무엇인가? 그러나 최근에는 자연 영상으로부터 문자를 추출하는 연구가 진행 되고 있다. 이러한 자연 영상에서 문자인식은 정형화된 문서와는 다르게 다양한 배경들이 존재하기 때문에 어려움을 겪고 있다. 뿐만 아니라 문자 인식에서 발생하는 오인식 문제로 인하여 잘못된 정보를 제공하게 되는 문제점을 가지고 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (19)

  1. A. Wojciechowsk and K. Siek,, "Barcode Scanning from Mobile-Phone Camera Photos Delivered Via MMS: Case Study," ER Workshops, pp.218-227, 2008. 

  2. D. M. Chen, S. S. Tsai, R.Vedantham, R. Grzeszczuk, and B. Girod, "Streaming Mobile Augmented Reality on Mobile Phones," ISMAR, pp.181-182, 2009. 

  3. C. Thillou and B. Gosselin, "Natural scene text understanding," Vision Systems, Segmentation and Pattern Recognition, Ch.16, pp.307-333, 2007. 

  4. A. Canedo-Rodriguez, S. H. Kim, J. H. Kim, and Y. Blanco-Fernandez, "English to Spanish translation of signboard images from mobile phone camera," Southeastcon, 2009. SOUTHEASTCON. IEEE , pp.356-361, 2009. 

  5. I. Haritaoglu, "Scene text extraction and translation for handheld devices," Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Vol.2, pp.408-413, 2001. 

  6. J. Yang, X. Chen, J. Zhang, Y. Zhang, and A. Waibel, "Automatic Detection and Translation of Text from Natural Scenes," Proceedings of the IEEE 2002 International Conference on Acoustics, Speech and Signal Processing (ICASSP '02), Vol.2, pp.2101-2104, 2002. 

  7. N. Ezaki, M. Bulacu, and L. Schomaker, "Text detection from natural scene images: towards a system for visually impaired persons," Pattern Recognition, ICPR 2004. Proceedings of the 17th International Conference on , Vol.2, pp.683-686, 2004. 

  8. C. Li, X. Ding, and Y. Wu, "Automatic text location in natural scene images," Proceedings of International Conference on Document Analysis and Recognition, pp.1069-1073, 2001. 

  9. M. L. Wick, M. G. Ross, and E. G. Learned- Miller, "Context-Sensitive Error Correction: Using Topic Models to Improve OCR," International Conference Document Analysis and Recognition, Vol.2, pp.1168-1172, 2007. 

  10. W. S. Rosenbaum and J. J. Hilliard, "Multifont OCR Postprocessing System," IBM Journal of Research and Development, Vol.19, No.4, pp.398-421, 1975. 

  11. S. Dobrisek, J. Zibert, N. Pavesic, and F. Mihelic, "An Edit-Distance Model for the Approximate Matching of Timed Strings," Pattern Analysis and Machine Intelligence, IEEE Transactions, Vol.31, No.4, pp.736-741, 2009. 

  12. J. J. Hell and S. N. Srihari, Experiments in Text Recognition with Binary n-Gram and Viterbi Algorithms," Pattern Analysis and Machine Intelligence, IEEE Transactions, Vol.PAMI-4, No.5, pp.520-530, 1982. 

  13. R. Shinghal and G. T. Toussaint, "Experiments in Text Recognition with the Modified Viterbi Algorithm," Pattern Analysis and Machine Intelligence, IEEE Transactions, Vol.PAMI-1,No.2, pp.184-193, 1979. 

  14. S. W. Kim and Y. Aoki, "A Postprocessing of HANGUL Recognitions Using Dictionary Lookup," JTC-CSCC: Joint Technical Conference on Circuits Systems, Computers and Communications Vol.2, pp.1013-1017, 1993. 

  15. R. S. Boyer and J. S. Moore, "A fast string searching algorithm," Comm. of ACM, Vol.20, No.10, pp.762-772, 1977. 

  16. V. Bansal and R.M.K. Sinha, "Integrating knowledge sources in Devanagari text recognition system," Systems, Man and Cybernetics, Part A: Systems and Humans, IEEE Transactions, Vol.30, No.4, pp.500-505, 2000. 

  17. R. M. K. Shinha and B. Prasada, "Visual text recognition through contextual processing," Pattern Recognition, Vol.21, No.5, pp.463-479, 1988. 

  18. H. Takashi, N. I. Amano, and A. Yamashita, "A spelling correction method and its application to and OCR system," Pattern Recognition, Vol.23, No.3/4, pp.363-377, 1990. 

  19. T. Okuda, E. Tanaka, and T.Kasai, "A Method for the Correction of Garbled Words Based on the Levenshtein Metric," Computers, IEEE Transactions, Vol.C-25, No.2, pp.172-178, 1976. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로