과거의 문자 인식 시도는 문자가 가지고 있는 속성정보(Meta-Information)에 무관한 인식을 수행하였으나, 현재는 문자의 속성정보를 이용한 광학폰트인식(Optical Font Recognition)을 주로 이용하고 있다. 그러나 우리나라 한글에 있어서는 광학 폰트 인식을 이용한 연구가 활발하지 못하다. 본 논문에서는 ...
과거의 문자 인식 시도는 문자가 가지고 있는 속성정보(Meta-Information)에 무관한 인식을 수행하였으나, 현재는 문자의 속성정보를 이용한 광학폰트인식(Optical Font Recognition)을 주로 이용하고 있다. 그러나 우리나라 한글에 있어서는 광학 폰트 인식을 이용한 연구가 활발하지 못하다. 본 논문에서는 OCR(Optical Character Recognition)의 성능 향상과 주제어(Keyword)중심 검색기술의 성능 향상 및 문자인식에 도움이 되는 광학 폰트 인식에 대해서 알아보고, 광학 폰트 인식 기술을 이용한 한글 서체 분류 시스템을 설계하고, 제안한 시스템 내에서의 세리프(serif) 계열과 산세리프(sans-serif) 계열 분류를 위한 특징을 제안한다. 한글서체는 획의 시작 부분에 장식 세리프가 있는 세리프 계열과 장식 돌기가 존재하지 않는 산세리프 계열로 나눌 수 있다. 본 논문에서는 세리프 형태에서 추출한 특징을 이용하여 세리프 또는 산세리프 클래스로 분류한 후, 각 클래스별로 적합한 특징 및 분류기를 학습하여 보다 다양한 서체를 인식하도록 계층적 시스템을 설계한다. 세리프 형태에서 추출하는 방법은 수직 획으로부터 세리프 영역을 식별한 후, 세리프 영역에 존재하는 런(run)들의 방향 벡터를 추출하여 36등분면 상의 위치를 계산하였다. 제안한 특징의 유용성을 입증하기 위한 실험은 명조, 바탕, 궁서, 고딕, 돋움, 굴림 서체의 6,000개 낱자 영상과 단어 영상 9,600개에 적용함을 관측하였다.
과거의 문자 인식 시도는 문자가 가지고 있는 속성정보(Meta-Information)에 무관한 인식을 수행하였으나, 현재는 문자의 속성정보를 이용한 광학폰트인식(Optical Font Recognition)을 주로 이용하고 있다. 그러나 우리나라 한글에 있어서는 광학 폰트 인식을 이용한 연구가 활발하지 못하다. 본 논문에서는 OCR(Optical Character Recognition)의 성능 향상과 주제어(Keyword)중심 검색기술의 성능 향상 및 문자인식에 도움이 되는 광학 폰트 인식에 대해서 알아보고, 광학 폰트 인식 기술을 이용한 한글 서체 분류 시스템을 설계하고, 제안한 시스템 내에서의 세리프(serif) 계열과 산세리프(sans-serif) 계열 분류를 위한 특징을 제안한다. 한글서체는 획의 시작 부분에 장식 세리프가 있는 세리프 계열과 장식 돌기가 존재하지 않는 산세리프 계열로 나눌 수 있다. 본 논문에서는 세리프 형태에서 추출한 특징을 이용하여 세리프 또는 산세리프 클래스로 분류한 후, 각 클래스별로 적합한 특징 및 분류기를 학습하여 보다 다양한 서체를 인식하도록 계층적 시스템을 설계한다. 세리프 형태에서 추출하는 방법은 수직 획으로부터 세리프 영역을 식별한 후, 세리프 영역에 존재하는 런(run)들의 방향 벡터를 추출하여 36등분면 상의 위치를 계산하였다. 제안한 특징의 유용성을 입증하기 위한 실험은 명조, 바탕, 궁서, 고딕, 돋움, 굴림 서체의 6,000개 낱자 영상과 단어 영상 9,600개에 적용함을 관측하였다.
While the past character recognition system didn't use any meta-information of character's, at present, Optical Character Recognition that utilizes meta-information of characters is used mainly. but, in the case of hangul, the researches using optical character recognition have not been actived. In ...
While the past character recognition system didn't use any meta-information of character's, at present, Optical Character Recognition that utilizes meta-information of characters is used mainly. but, in the case of hangul, the researches using optical character recognition have not been actived. In this thesis, we introduce a Optical Font Recognition(OFR) that can be used to improve the performance of Optical Character Recognition(OCR) and keyword spotting retrieval technologies on Korean documents. And then we propose the system of typeface classification for Hangul characters and the features that can be exploited to classify typefaces into serif and sans-serif in the proposed system. There are two classes in Hangul typefaces. The one is the serif class has a small decorative stroke around the beginning of vertical strokes. The other is the sans-serif class that does not have no serif. In this thesis, The proposed hangul typeface classification method exploits the serif features to classify hangul typeface serif and sans-serif. After classification, a hierarchical system is designed to recognize various type face sin each class fitted features and learn classifier. The serif part is first segmented from the vertical strokes, and the 36 direction of the serif is computed as the feature for Hangul typeface identification. To evaluate the performance of the proposed system, we used 6,000 characters and 9,600 words extracted from Korean documents.
While the past character recognition system didn't use any meta-information of character's, at present, Optical Character Recognition that utilizes meta-information of characters is used mainly. but, in the case of hangul, the researches using optical character recognition have not been actived. In this thesis, we introduce a Optical Font Recognition(OFR) that can be used to improve the performance of Optical Character Recognition(OCR) and keyword spotting retrieval technologies on Korean documents. And then we propose the system of typeface classification for Hangul characters and the features that can be exploited to classify typefaces into serif and sans-serif in the proposed system. There are two classes in Hangul typefaces. The one is the serif class has a small decorative stroke around the beginning of vertical strokes. The other is the sans-serif class that does not have no serif. In this thesis, The proposed hangul typeface classification method exploits the serif features to classify hangul typeface serif and sans-serif. After classification, a hierarchical system is designed to recognize various type face sin each class fitted features and learn classifier. The serif part is first segmented from the vertical strokes, and the 36 direction of the serif is computed as the feature for Hangul typeface identification. To evaluate the performance of the proposed system, we used 6,000 characters and 9,600 words extracted from Korean documents.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.