$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

한글 획요소 추출 학습에서 적용 글자의 확장에 따른 추출 성능 분석
Analysis of Extraction Performance according to the Expanding of Applied Character in Hangul Stroke Element Extraction 원문보기

멀티미디어학회논문지 = Journal of Korea Multimedia Society, v.23 no.11, 2020년, pp.1361 - 1371  

전자연 (Dept. of IT Engineering, Graduate School, Sookmyung Women's University) ,  임순범 (Dept. of IT Engineering and Research Institute ICT Convergence, Sookmyung Women's University)

Abstract AI-Helper 아이콘AI-Helper

Fonts have developed as a visual element, and their influence has rapidly increased around the world. Research on font automation is actively being conducted mainly in English because Hangul is a combination character and the structure is complicated. In the previous study to solve this problem, the...

주제어

표/그림 (15)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 글꼴은 학습여부와 상관없이 정형글꼴계층의 모든 글꼴범위로 확장하여 성공률 높게 한글 획요소를 추출할 수 있어 처음 제안한 시스템의 목적인 유사도 판단에는 사용할 수 있는 소기의 목적을 달성하였다. 글자 범위를 확장했을 때에 학습한 글자에서보다 근소하게 성공률이 낮은 이유는 ‘꺾임’, ‘돌출‘, ‘닫힘’ 등의 낱글자 “ㅁ"에서 추출되는 획요소의 성공률이 낮았기 때문이라 판단된다.
  • 특히 글꼴 범위를 확장하였을 때에는 학습 여부와 관계없이 성공률 높게 획요소가 모두 자동으로 추출되었다. 따라서 선행 연구의 본래 목적이었던 한글 글꼴 유사도 판단을 목적으로 한다면 다양한 글꼴을 필요로 할 뿐 다른 글자에서 획요소를 추출할 필요는 없으므로 해당 시스템을 이용하여 해결될 것이다. 하지만 본 연구에서 확인해보고자 했던 글자 범위를 확장하였을 때에는 학습하지 않은 글자보다 학습한 글자의 추출 성공률이 매우 근소하게 높았다.
  • 따라서 향후 통계적으로도 확장 여부에 따라 성공률의 차이가 없는 추출 모델을 구현하기 위해추출된 데이터를 바탕으로 판단하여 새로운 글자의 획요소를 능동적으로 찾아주어 데이터 수를 늘려가 추출 모델을 강화시키는 반지도 능동 학습(Semi-Supervised Learning)을 도입하여 획요소 추출 학습을 진행하고자 한다. 이를 통해 11,172자의 글자에 대한 획 요소 데이터를 점차적으로 늘려감으로써 모든 자소 단위의 글자를 지원할 수 있어 획요소 추출의 대한 성공률이 완벽하게 높은 모델이 될 것이라 판단한다.
  • 본 논문에서는 선행 연구에서 제안한 Faster RCNN 기반의 한글 획요소 추출 시스템을 이용하여 모든 글꼴과 글자에서 획요소를 추출할 수 있는지 확인해보고자 추출 적용 글자의 확장에 따른 실험 모델을 설계하고 그에 따른 평가 방법을 정의하여 성능을 비교하였다. 이 때, 글자의 확장은 글꼴의 확장과 함께 비교하여 살펴보았으며, 이 외에도 추가로 글꼴의 계열이나 글꼴의 굵기에 따라서도 한글 글꼴 획요소를 추출하는 데 성능의 차이가 존재하는지 고려해보았다.
  • 본 논문에서는 선행 연구에서 제안한 Faster RCNN 기반의 한글 획요소 추출 시스템을 이용하여 모든 글꼴과 글자에서 획요소를 추출할 수 있는지 확인해보고자 추출 적용 글자의 확장에 따른 실험 모델을 설계하고 그에 따른 평가 방법을 정의하여 성능을 비교하였다. 이 때, 글자의 확장은 글꼴의 확장과 함께 비교하여 살펴보았으며, 이 외에도 추가로 글꼴의 계열이나 글꼴의 굵기에 따라서도 한글 글꼴 획요소를 추출하는 데 성능의 차이가 존재하는지 고려해보았다. 그 결과, 전반적으로 높은 점수가 도출되어 제안한 모델은 적용 대상을 확장하였을 때에도 성공률이 높게 획요소가 추출된다고 판단할 수 있었다.
  • 학습 모델의 성능은 다른 글자에서는 아직 검증되지 않았다. 한글은 총 11,172자로 구성되어 있어 일일이 모든 글꼴과 글자에서 획요소 검출 학습을 진행하기는 현실적으로 불가능하여[14-16] 본 연구에서는 획요소 추출의 적용 대상을 학습한 글자 외의 다른 글자로 확장했을 때에도 제대로 추출이 가능한 지 확인해보고자 한다. 모든 글자와 글꼴을 대상으로 획요소가 자동으로 추출되어 이를 바탕으로 글꼴의 시각적 분석(Visual Font Recognition)을 진행한다면 한글 글꼴의 유사도 판단 외에도 글꼴 추천, 분류, 검색 등 한글에서도 모든 분야에서 자동화가 가능해질 것이다.
  • 해당 연구는 한글 글꼴 간의 유사도 판단을 하고자 진행된 연구로 추출할 획요소를 선정하기 위해 한글 글꼴의 모양에 대한 속성을 정리한 후 폰트 업계 종사자 5명을 대상으로 유사도 판단을 위한 대표 한글 획요소를 선정하는 평가를 진행하였다. 그 결과 한글 글꼴 획요소를 ‘삐침’, ‘꺾임’, ‘돌출’, ‘닫힘’, ‘상투’, ‘부리’, ‘가지’, ‘꼭지점’ 총 8가지로 선정하였으며, 글꼴 범위는 정형글꼴 계층[17]으로 한정하였다.

가설 설정

  • 글꼴의 굵기 요인에 대한 세 집단의 평균 차이 분석을 위해 일원배치 분산 분석(ANOVA)을 수행하였다. 일원배치 분산분석의 귀무가설은 ‘글꼴 굵기 별별 글꼴 획요소 자동 추출의 성공률은 모두 동일하다.’ 이다.
본문요약 정보가 도움이 되었나요?

참고문헌 (21)

  1. E. Shin and J. Song, "Visual Characteristics of Korean Kinetic Typography According to Tone and Voice on Youtube," Journal of the Korean Society Design Culture, Vol. 26, No. 2, pp. 267-278, 2020. 

  2. KISDI, In the Era of the 4th Industrial Revolution, Media Content Survival Strategy, KISDI Premium Report 17-14, 2017. 

  3. G. Chen, et al., "Large-scale Visual Font Recognition," Proceeding of IEEE Conference on Computer Vision and Pattern Recognition, pp. 3598-3605, 2014. 

  4. Z. Wang, et al., "Deepfont: Identify your Font from an Image," Proceeding of 23rd ACM International Conference Multimedia, pp. 451-459, 2015. 

  5. T. Chen, Z. Wang, N. Xu, H. Jin, and J. Luo, "Large-scale Tag-based Font Retrieval With Generative Feature Learning," Proceeding of IEEE/CVF International Conference on Computer Vision, pp. 9115-9124, 2019. 

  6. S. Jiang, Z. Wang, A. Hertzmann, H. Jin, and Y. Fu, "Visual Font Pairing," Proceeding of IEEE Transactions on Multimedia, pp. 2086-2097, 2020. 

  7. Korea National Hangul Museum, Survey and Prospect of Font Industry in 2015, Korea National Hangul Museum Research Report, 2015. 

  8. J. Jeon and S. Lim, "Research on Hangul Stroke Element Classification and Automatic Extraction Using SVM and Sliding Window Algorithm," Proceeding of the Fall Conference of the Korea Multimedia Society, pp. 732, 2019. 

  9. J. Jeon and S. Lim, "Machine Learning Based Automatic Extraction of Stroke Elements in Hangul Font," Proceeding of the 8th Korea Japan Joint Workshop on Complex Communication Sciences, pp. 53-55, 2020. 

  10. J. Jeon, D. Park, S. Lim, Y. Ji, and S. Lim, "Automatic Extraction of Hangul Stroke Element Using Faster R-CNN for Font Similarity," Journal of Korea Multimedia Society, Vol. 23, No. 8, pp. 953-964, 2020. 

  11. B. Chakraborty, O. Rudovic, and J. Gonzalez, "View-invariant Human-body Detection with Extension to Human Action Recognition Using Component-wise HMM of Body Parts," Proceeding of 8th IEEE International Conference on Automatic Face and Gesture Recognition, pp. 1-6, 2008. 

  12. S.D. Meena and L. Agilandeeswari, "An Efficient Framework for Animal Breeds Classification Using Semi-supervised Learning and Multi-part Convolutional Neural Network (MP-CNN)," Proceeding of IEEE Access, Vol. 7, No. 1, pp. 151783-151802, 2019. 

  13. B. Heiselet, T. Serre, M. Pontil, and T. Poggio, "Component-based Face Detection," Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, pp. 657-662, 2001. 

  14. S. Lim, "Development Trend of Font Technology," Typeface 1999 of Korean Typeface Development Research Center, pp. 95-134, 1999. 

  15. S. Lim, H. Kim, H. Chung, K. Park, and K. Choi, "Hangul Font Editor Based on Multiple Master Glyph Algorithm," Korea Institute of Information Scientists and Engineers Transactions on Computing Practices, Vol. 21, No. 11, pp. 699-705, 2015. 

  16. J. Jeon, Y. Ji, D. Park, and S. Lim, "Evaluation of Criteria for Mapping Characters Using an Automated Hangul Font Generation System Based on Deep Learning," Journal of Korea Multimedia Society, Vol. 23, No. 7, pp. 850-861, 2020. 

  17. D. Park, J. Jeon, Y. Ji, and S. Lim, "Design of Structure Map for Modeling Hierarchical Structure Information of Hangul," Proceeding of the Fall Conference of the Korea Multimedia Society, pp. 578-579, 2019. 

  18. TTA, Hangul Font Production Guides For Font Registration System Part 2. Design Based Classification, e-Publishing Project Group 608, TTAK.KO-10.0906-part2, Telecommunication Technology Association, 2016. 

  19. H. Kim and S. Lim, "Standardization Study of Font Shape Classification for Hangul Font Registration System," Journal of Korea Multimedia Society, Vol. 20, No. 3, pp. 571-580, 2017. 

  20. H. Kim and S. Lim, "Shape Property Study of Hangul Font for Font Classification," Journal of Korea Multimedia Society, Vol. 20, No. 9, pp. 1584-1595, 2017. 

  21. D.L. Olson, D. Delen, Advanced Data Mining Techniques, Springer Publishers, Berlin, 2008. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로