$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

문자 인식 향상을 위한 회전 정렬 알고리즘에 관한 연구
A Study on Rotational Alignment Algorithm for Improving Character Recognition 원문보기

한국융합학회논문지 = Journal of the Korea Convergence Society, v.10 no.11, 2019년, pp.79 - 84  

진고환 (우송대학교 IT융합학부)

초록
AI-Helper 아이콘AI-Helper

영상을 기반으로 하는 기술들의 지속적인 발전으로 다양한 분야에서 활용되고 있고, 카메라를 통하여 획득한 영상의 객체를 분석하고 판별하는 비전 시스템의 기술 수요가 급속하게 증가하고 있다. 비전 시스템의 핵심 기술인 영상처리는 반도체 생산 분야의 불량 검사, 타이어 표면의 숫자 및 심볼과 같은 객체 인식 검사 등에 사용되고 있고, 자동차 번호판 인식 등의 연구가 계속하여 이루어지고 있는 실정으로, 객체를 신속, 정확하게 인식할 필요가 있다. 본 논문에서는 곡면과 같은 곳에 마킹되어 있는 숫자나 심볼과 같이 기울어진 객체를 인식하기 위하여 입력된 영상 이미지의 객체 기울기에 대한 각도 값을 확인하여 객체의 회전 정렬을 통한 인식 모델을 제안한다. 제안 모델은 컨투어 알고리즘을 기반으로 객체 영역을 추출하고, 객체의 각도를 산출한 후, 회전 정렬된 이미지에 대한 객체 인식을 진행할 수 있는 모델이다. 향후 연구에서는 기계학습을 통한 탬플릿 매칭 연구가 필요하다.

Abstract AI-Helper 아이콘AI-Helper

Video image based technology is being used in various fields with continuous development. The demand for vision system technology that analyzes and discriminates image objects acquired through cameras is rapidly increasing. Image processing is one of the core technologies of vision systems, and is u...

주제어

표/그림 (11)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • 컨투어 추출은 find 컨투어 함수를 사용해서 추출하였고, 추출된 컨투어 영역들 전체에 대한 각도를 추출하였다. 각도 추출은 외곽선을 사각형으로 지정하여 가로, 세로 길이를 추출한 후 가로, 세로 길이에서 최대값을 1차적으로 설정하였으며, 추출한 최대값은 컨투어를 사용하여 전체 외각선에서 최대값을 추출한 후 각도를 산출하였다.
  • 셋째, 컨투어를 사용하여 테두리에 대한 각도를 추출한다. 넷째, 추출한 각도를 사용하여 이미지 회전을 진행한다. 다섯째, 회전된 이미지를 사용하여 인식을 진행한다.
  • 넷째, 추출한 각도를 사용하여 이미지 회전을 진행한다. 다섯째, 회전된 이미지를 사용하여 인식을 진행한다. 영상 이미지의 인식이 실패할 경우, 회전이 역방향으로 정렬되었다고 판단하고, 다시 이미지 회전을 실행하여 인식한다.
  • 첫째, Probe로부터 영상 이미지를 획득한다. 둘째, 입력받은 이미지를 전처리 기술인 적응적 이진화를 진행한다. 셋째, 컨투어를 사용하여 테두리에 대한 각도를 추출한다.
  • 제안 모델의 실험 및 측정을 위하여 분해능 82㎛,FOV 257*206 성능의 CCD 카메라 사용하였고, 비주얼 스튜디오 2017 기반의 MFC와 전처리 기능을 위하여 OpenCV 라이브러리를 사용하였다. 상단은 CCD 카메라에서 입력받은 이미지, 적응적 이진화를 진행한 이미지, 컨투어를 사용하여 회전을 진행한 이미지가 출력되도록 구성하였으며, 하단 리스트 박스는 추출된 회전 각도별로 인식된 숫자 개수를 출력하도록 구성하였다. 다음의 Fig.
  • 둘째, 입력받은 이미지를 전처리 기술인 적응적 이진화를 진행한다. 셋째, 컨투어를 사용하여 테두리에 대한 각도를 추출한다. 넷째, 추출한 각도를 사용하여 이미지 회전을 진행한다.
  • CCD 카메라로부터 입력받은 인식 대상의 객체 기울기에 대한 각도 값을 확인하여 객체를 정렬하면, 영상 처리에 있어 다양성과 유용성이 증가할 수 있다. 숫자를 인식하는데 있어서 각도는 숫자와 같은 객체의 인식률에 많은 영향이 있기에, 본 논문에서는 입력된 영상 이미지에서 컨투어 알고리즘을 기반으로 숫자 영역을 추출하여 객체 이미지의 각도를 구한 후, 회전 정렬된 이미지에 대한 인식 모델을 제안한다. 제안 모델을 비전 시스템에 적용하여 숫자와 같은 객체를 인식할 경우 불량 검출이 정확해 질 것으로 기대된다.
  • 회전된 이미지를 사용하여 마스터 이미지의 인식을 진행한다. 이미지 인식은 MIL라이브러리를 사용하였으며,인식 과정에서 이미지가 반대로 회전된 경우 인식률이 낮아 오류로 처리하였다. 제안 모델에서는 반대로 회전된 경우 다시 180도로 이미지 회전을 진행하고, 다시 인식을 진행하였다.
  • 3은 임계값 추출을 위한 (a) 원본 이미지와 (b) 히스토그램 추출 이미지이다. 임계값을 추출하기 위하여, 히스토그램을 추출하였고, 최대값인 254를 임계 값으로 설정하여 이진화를 진행하였다.
  • 이미지 인식은 MIL라이브러리를 사용하였으며,인식 과정에서 이미지가 반대로 회전된 경우 인식률이 낮아 오류로 처리하였다. 제안 모델에서는 반대로 회전된 경우 다시 180도로 이미지 회전을 진행하고, 다시 인식을 진행하였다. 다음 Fig.
  • 5는 입력된 원본 이미지와 적응적 이진화를 진행한 이미지이다. 제안 모델에서는 컨투어를 진행하기 위하여 일반적인 이진화가 아닌 적응적 이진화를 수행하였다. 컨투어 기능 특성상 배경이 검은색, 타겟은 흰색으로 구성되어 있어야 기능을 수행할 수 있기에 적응적 이진화를 적용하였다.
  • 제안 모델에서는 테두리에 대한 각도를 추출하기 위해서 추출된 각도들 중에서 추출된 외곽선에서 최대길이의 외곽선을 추출하여 회전을 진행한다. 다음의 Fig.
  • 제안 모델에서는 컨투어를 진행하기 위하여 일반적인 이진화가 아닌 적응적 이진화를 수행하였다. 컨투어 기능 특성상 배경이 검은색, 타겟은 흰색으로 구성되어 있어야 기능을 수행할 수 있기에 적응적 이진화를 적용하였다.
  • 컨투어 추출은 find 컨투어 함수를 사용해서 추출하였고, 추출된 컨투어 영역들 전체에 대한 각도를 추출하였다. 각도 추출은 외곽선을 사각형으로 지정하여 가로, 세로 길이를 추출한 후 가로, 세로 길이에서 최대값을 1차적으로 설정하였으며, 추출한 최대값은 컨투어를 사용하여 전체 외각선에서 최대값을 추출한 후 각도를 산출하였다.

대상 데이터

  • 제안 모델의 실험 및 측정을 위하여 분해능 82㎛,FOV 257*206 성능의 CCD 카메라 사용하였고, 비주얼 스튜디오 2017 기반의 MFC와 전처리 기능을 위하여 OpenCV 라이브러리를 사용하였다. 상단은 CCD 카메라에서 입력받은 이미지, 적응적 이진화를 진행한 이미지, 컨투어를 사용하여 회전을 진행한 이미지가 출력되도록 구성하였으며, 하단 리스트 박스는 추출된 회전 각도별로 인식된 숫자 개수를 출력하도록 구성하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
비전 시스템이란 무엇인가? 비전 시스템은 영상과 컴퓨터를 융합하여 영상 이미지를 획득, 분석, 판별하는 시스템으로서 산업분야에서 생산품을 검사하는 자동화 공정에 사용되고 있고, 제품을 생산하는 기업을 대상으로 비전 시스템 도입이 큰 이슈로 대두되고 있다[3-5]. 영상 처리는 비전 시스템의 핵심기술 중 하나로서, 반도체 생산 분야에서 불량 검사, 타이어 표면의 숫자 및 심볼의 인식 검사에 사용되고 있고[6,7], 문자 인식 분야에서는 자동차 번호판 인식 향상에 관한 연구[8,9], 기계 부품 도면에 포함되어 있는 문자의 인식 성능을 개선하기 위한 연구[10] 및 입력된 영상의 장면을 탐색하는 기법 및 획득된 영상을 인식하여 객체를 추출하는 방법 연구[11,12]와 같이 영상 처리와 관련된 연구가 진행되고 있다.
이진화 기법 중 블록의 개념을 기반으로 수행하는 것은? 입력된 영상의 이진화는 전역적, 지역적 이진화로 분류되고 있으며, 전역적 이진화는 1개의 임계값으로 입력 영상 전체를 신속하게 이진화하는 방법이며, 지역적 이진화는 입력 영상의 화소를 기준으로 M× N 크기의 블록으로 분할하고, 각 블록마다 상이한 임계값을 설정하여 적용하는 이진화 기법이다. 적응적 이진화는 블록의 개념을 기반으로 수행하며, 각 블록내의 연산을 통하여 임계값을 산출하고, 이 임계값이 속해 있는 영상 이미지의 부분이나, 픽셀을 대상으로 이진화를 수행하며, 다음의 (식 1)은 임계값을 구하는 식으로, S는 설정한 블록 내의 합, k는 임계값 조절 변수, Np는 블록내의 픽셀의 수이다[17]. 조명의 변화에 매우 강인한 적응적 이진화 기법은 좋은 성능 지니고 있다.
히스토그램 평활화의 목적은 무엇인가? 입력된 이미지가 밝거나 어두운 경우와 같이 한쪽으로 치우칠 경우에, 명도값의 히스토그램을 균등하게 분배함으로서 영상의 밝기 조정이 가능하다. 히스토그램 평활화는 분포가 일정한 히스토그램을 생성하는 것을 목적으로 하고 있으며, 밝은 영상은 어둡게 하고, 어두운 영상은 밝아지게 하여 적당한 명도값을 유지시키는 것으로, 평활화 과정은 다음의 (식 2)를 거쳐 (식 3)과 같은 단계로 진행된다[18].
질의응답 정보가 도움이 되었나요?

참고문헌 (18)

  1. S. H. Kim. (2016). Realtime 3D Human Full-Body Convergence Motion Capture using a Kinect Sensor. Journal of Digital Convergence, 14(1), 189-194. DOI : 10.14400/JDC.2016.14.1.189 

  2. M. Janoczki, A. Becker, L. Jakab, R. Grof & T. Takacs. (2013). Automatic Optical Inspection of Soldering. In aterial Science-Advanced Topics. 387-440. DOI : 10.5772/51699 

  3. Y. R. Seo, K. Park, S. K. Kim & S. W. Ra. (2011). Vibration Analysis for a Feeding Unit of Vision Inspection System of Precision Screws. Journal of The Korean Society of Manufacturing Technology Engineers, 20(4), 446-451. 

  4. G. S. Kim, Y. H. Park, J. S. Park & J. S. Cho. (2015). Auto parts visual inspection in severe changes in the lighting environment. Journal of Institute of Control, Robotics and Systems, 21(12), 1109-1114. DOI : 10.5302/J.ICROS.2015.15.0134 

  5. J. J. Park, G. H. Kim & E. S. Lee. (2014). A study on the elliptical gear inspection system using machine vision. Transactions of the Korean Society of Mechanical Engineers A, 38(1), 59-63. DOI : 10.3795/KSME-A.2014.38.1.059 

  6. T. H. Lee, K. R. Park & D. H. Kim. (2017). A Study on Scratch Detection of Semiconductor Package using Mask Image. Journal of the Korea Convergence Society, 8(11), 43-48. DOI : 10.15207/JKCS.2017.8.11.043 

  7. G. W. Jin. (2017). A Study on the BGA Package Measurement using Noise Reduction Filters. Journal of the Korea Convergence Society, 8(11), 15-20. DOI : 10.15207/JKCS.2017.8.11.015 

  8. J. W. Jang & G. M. Park. (2017). License Plate Recognition System based on Normal CCTV. Journal of The Institute of Electronics and Information Engineers, 54(8), 89-96. DOI : 10.5573/ieie.2017.54.8.89 

  9. M. K. Oh & J. C. Park. (2017). Long Distance Vehicle License Plate Region Detection Using Low Resolution Feature of License Plate Region in Road View Images. Journal of Digital Convergence, 15(1), 239-245. DOI : 10.14400/JDC.2017.15.1.239 

  10. H. R. Shin, S. H. Lee, J. S. Park & J. K. Song. (2019). Performance Improvement of Optical Character Recognition for Parts Book Using Pre-processing of Modified VGG Model. The Journal of the Korea Institute of Electronic Communication Sciences, 14(2), 433-438. DOI : 10.13067/JKIECS.2019.14.2.433 

  11. M. K. Kwon & H. S. Yang. (2017). A scene search method based on principal character identification using convolutional neural network, Journal of Convergence for Information Technology, 7(2), 31-36. DOI : 10.22156/CS4SMB.2017.7.2.031 

  12. S. K. Lee, Y. S. Park, G. S. Lee, J. Y. Lee & S. H. Lee. (2013). An Automatic Object Extraction Method Using Color Features of Object and Background in Image. Journal of Digital Convergence, 11(12), 459-465. DOI : 10.14400/JDPM.2013.11.12.459 

  13. H. J. Hahm. (2017). A Study of Smart Factory Policy For ICT-Based. Journal of the Global e-Business Association, The e-Business Studies, 18(6), 363-380. DOI : 10.20462/TeBS.2017.12.18.6.363 

  14. D. Zhao. (2010). A Study on the Face Expressive Recognition based on the Skin Color and the Face Geometric Characteristics. Master's Thesis. PaiChai University, Daejeon. 

  15. J. Y. Song. (2018). A Recognition Algorithm of Handwritten Numerals based on Structure Features. The Journal of The Institute of Internet, Broadcasting and Communication, 18(6), 151-156. DOI : 10.7236/JIIBC.2018.18.6.151 

  16. C. H. Woo. (2013). Image Preprocessing in Container Identifier Recognition System Using Multiple Threshold Regions. Journal of Korea Multimedia Society, 16(5), 549-557. DOI : 10.9717/kmms.2013.16.5.549 

  17. Y. S. Hwang, H. Y. Yu & J. M. Lee. (2016). Robust Visual Odometry System for Illumination Variations Using Adaptive Thresholding. Journal of Institute of Control, Robotics and Systems, 22(9), 738-744 DOI : 10.5302/J.ICROS.2016.15.0218 

  18. S. H. Kwon, H. C. Jeong, S. T. Seo, I. K. Lee & C. S. Son. (2008). Histogram equalization-based thresholding. IEICE TRANSACTIONS on Information and Systems, 91(11), 2751-2753. DOI: 10.1093/ietisy/e91-d.11.2751 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로