$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

초록
AI-Helper 아이콘AI-Helper

현재 유니코드에서 한글 텍스트의 인코딩 기법은 '완성형 현대한글 음절'과 주로 옛한글을 표현하는데 사용되는 '자모 조합형 한글'로 나뉘고 있다. 그러나 정규화 변환과 유니코드의 한글자모 조합 규정에서 자모와 완성형 현대한글 음절을 다시 조합하여 한글음절로 사용할 수 있게 허용했기 때문에, 구현하는 사람마다 각기 서로 다르게 한글 인코딩을 하고 있다. 이는 인코딩과 정규화 형식을 처음 작성할 당시 옛한글의 확장 사용을 고려하지 않았거나, 한글에 대한 올바른 이해가 부족한 상태에서 작성된 데 따른 결과라 하겠다. 결과적으로 한 개의 한글음절에 대한 여러 가지 표현 방법이 존재함으로써 한글 문자열의 검색, 비교, 정렬에 문제점이 발생한다. 따라서 본 연구에서는 현재 사용되고 있는 한글 인코딩 방법을 중심으로 정규화에 의한 부작용 등의 문제점을 분석하고, 이들을 올바르게 처리하기 위한 효율적인 단일 한글 인코딩 표준 방안을 제안한다.

Abstract AI-Helper 아이콘AI-Helper

In Unicode, two types of Hangul encoding schemes are currently in use, namely, the "precomposed modern Hangul syllables" model and the "conjoining Hangul characters" model. The current Unicode Hangul conjoining rules allow a precomposed Hangul syllable to be a member of a syllable which includes con...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 1 에서 4.L4까지 나열한 전제조건이 가장 이상적인 한글코드 표현의 조건이라고 할 수는 없지만, 한글코드와 인코딩은 실제 구현에서 널리 사용되어야 하고, 이전의 인코딩과 호환이 가능하여야 하기 때문에 실용적인 측면에서 제한을 가하고자 한다.
  • 가장 최근에 정의되어 Microsoft Word 2002판 이후부터 적용되고 있는 유니코드 표준을 이용한 옛한글 지원 방식을 살펴보기로 하겠다. 앞서 3.
  • 따라서 이 연구에서는 현재 유니코드를 기반으로 옛 한글을 지원하는 한글 인코딩 방법[8, 9]을 중심으로, 한글 문자열의 검색, 비교, 정렬을 쉽게 할 수 있으며 정규화의 부작용을 최소화 할 수 있는 효율적인 한글 인코딩 방안을 제안하여 올바른 한글처리를 할 수 있도록 하고자 한다.
  • 자세히 살펴보았다. 따라서 효율적언 한글 인코딩 방안을 제안하기 위한 몇 가지 전제 조건을 먼저 제시하고자 한다. 4.
  • 손쉽게 구분하고 처리할 수 있다. 이 부분에 대해서는 코드를 연구하는 사람들 사이에 이견이 있을 수 있겠으나, 본 연구의 목적 자체가 한글에 있어서의 인코딩을 효율적으로 하기 위함이기 때문에 연구의 기본 목적에 맞는 유일성을 확보하기 위한 노력으로 최선의 길을 선택하였다. 다음의 표 5는 그 사용 예이다.
  • 현재 사용되고 있는 조합형 옛한글 인코딩 기법을 살펴보기로 하자. 비표준 방식인 사용자 정의 영역을 이용하는 방법과 유니코드의 자모를 이용하지만, 부족한 옛 한글 자모를 흩자모를 이용하여 조합해서 쓰는 비효율적인 조합방식이 바로 그것이다.

가설 설정

  • 2) 조합형 현대한글을 완성형 현대한글로 바꾸는 경우에는 해당 문자열을 NFC로 정규화 하면 된다. 별도의 함수를 작성하더라도 테이블 없이 단순한 계산만으로 처리할 수 있다.
  • 3.1.1 완성형 현대한글은 조합형 음절의 일부인가?

  • 4.2.3 기존의 자모는 재조합하지 않는다

본문요약 정보가 도움이 되었나요?

참고문헌 (20)

  1. 산업표준심의회, '국제 문자 부호 계 KS X 1005', 한국표준협회, 2002 

  2. The Unicode Consortium, 'The Unicode Standard 5.0,' Addison-Wesley, 2006 

  3. Mark Davis, Matrin Durst, 'Unicode Normalization Forms 5.0.0 - UAX #15,' The Unicode Consortium, 2006 

  4. Matrin Durst, Francois Yergeau, Richard Ishida, Misha Wolf, Tex Texin, 'Character Model for the World Wide Web 1.0: Normalization,' The World Wide Web Consortium (W3C), 2005 

  5. Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, Eve Maler, Francois Yergeau, 'Extensible Markup Language (XML) 1.0,' The World Wide Web Consortium (W3C), 2006, Appendix B. Definitions for Character Normalization 

  6. Patrick Faltstrom and Paul Hoffman, Adam M. Costello, 'Internationalizing Domain Names in Applications (IDNA) - RFC 3490,' The Internet Engineering Task Force (IETF), 2003, Section 10. Security Considerations 

  7. 안대혁, 박영배, '유니코드 환경에서의 올바른 한글 정규화를 위한 수정 방안', 정보과학회 논문지 제34권 2호, 2007, pp. 169-177 

  8. 안상규, 김성재, 신병훈, '마이크로소프트 워드2002에서의 옛한글 구현', 한국마이크로소프트, 2001 

  9. Microsoft, 'Creating and Supporting OpenType fonts for Old Hangul,' Microsoft Corp, 2000 

  10. 산업표준심의회, '정보 교환용 부호계(한글 및 한자) KS X 1001', 한국표준협회, 2004 

  11. (주)한글과컴퓨터, '한글코드와 자판에 대한 기초 연구', 문화부, 1992, pp. 15-72 

  12. 이승호, 이수연, 정호원, 강태진, 김경석, 변정용, 이동철, 이준희, 안대혁, 조증성, '단일문자 표준 연구', 한국전산원, 1993 

  13. 기술표준원, '국제문자부호계 KS규격의 국제규격부합화 연구', 한국표준협회, 2000 

  14. 홍윤표, '한글코드에 관한 연구', 국립국어연구원, 1995 

  15. 정우봉, '문자코드 표준화 연구', 국립국어원, 2004, pp. 11-19 

  16. Unicode, 'Unicode Standard Annex #28 - Unicode 3.2,' The Unicode Consortium, 2002, Section 3.11 Conjoining Jamo Behavior (revision) 

  17. Mark Davis, 'Draft Unicode Technical Report #15, Revision 11,' The Unicode Consortium, 1999, Section 'Hangul Composition' 

  18. 안대혁, 김경석, 'A Proposal to add new Hangul Jamo extended characters to BMP of UCS,' ISO/IEC SC2/WG2 N3168, 2006 

  19. Mike Ksar, 'Resolutions of WG 2 meeting 50,' ISO/IEC SC2/WG2 N3254, 2007, Resolution M50.34 (Hangul Jamo additions) 

  20. ISO/IEC SC2, 'ISO/IEC 10646: 2003/PDAM 5 Ballot,' ISO/IEC SC 2 N 3940, 2007 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로