본 논문은 국제적 문자부호체계인 유니코드 내에 있는 한글낱자와 호환용 한글낱자 부호를 통신망에 전송하기 위해 UTF-8부호로 변환할 때 회선부호기에서 발생하는 스크램블링의 발생빈도를 연구하였다. 본 논문에서 적용한 회선부호기의 스크램블링 방식은 ITU 및 한국의 표준전송방식인 HDB-3방식으로 하였다. 각 한글낱자부호에서 발생하는 스크램블링을 분석하기 위해 원천 부호화규칙을 적용하였다. 스크램블링 발생량은 각 한글낱자에서 발생하는 스크램블링의 발생횟수와 각 한글낱자의 사용빈도에 의한 발생 빈도율을 추출하였다. 연구결과 한글낱자의 부호에 대한 스크램블링 발생은 유니코드 체계내에서 24번, 52%, UTF-8체계 내에서 148번, 228%발생하였다. 호환용 한글낱자 부호에서는 유니코드 체계내에서 10번, 14%, UTF-8 체계 내에서 83번, 131%발생하였다. 즉, 유니코드체계의 한글낱자와 호환용 한글낱자는 UTF-8체계로 변환하면서 스크램블링 발생 빈도율이 각각 340%, 851%증가하는 것으로 나타났다.
본 논문은 국제적 문자부호체계인 유니코드 내에 있는 한글낱자와 호환용 한글낱자 부호를 통신망에 전송하기 위해 UTF-8부호로 변환할 때 회선부호기에서 발생하는 스크램블링의 발생빈도를 연구하였다. 본 논문에서 적용한 회선부호기의 스크램블링 방식은 ITU 및 한국의 표준전송방식인 HDB-3방식으로 하였다. 각 한글낱자부호에서 발생하는 스크램블링을 분석하기 위해 원천 부호화규칙을 적용하였다. 스크램블링 발생량은 각 한글낱자에서 발생하는 스크램블링의 발생횟수와 각 한글낱자의 사용빈도에 의한 발생 빈도율을 추출하였다. 연구결과 한글낱자의 부호에 대한 스크램블링 발생은 유니코드 체계내에서 24번, 52%, UTF-8체계 내에서 148번, 228%발생하였다. 호환용 한글낱자 부호에서는 유니코드 체계내에서 10번, 14%, UTF-8 체계 내에서 83번, 131%발생하였다. 즉, 유니코드체계의 한글낱자와 호환용 한글낱자는 UTF-8체계로 변환하면서 스크램블링 발생 빈도율이 각각 340%, 851%증가하는 것으로 나타났다.
This paper has studied about the scrambling occurrence frequency in UTF-8 coding system for Unicode Hangul Jamo codes. The scrambling methode applied in the study is HDB-3 in AMI line coding that is international transmission standard. In the study, the source coding rule was applied to analysis the...
This paper has studied about the scrambling occurrence frequency in UTF-8 coding system for Unicode Hangul Jamo codes. The scrambling methode applied in the study is HDB-3 in AMI line coding that is international transmission standard. In the study, the source coding rule was applied to analysis the scrambling occurrence. The quantity of the scrambling occurrence was calculated by the number of times and frequency rate of the scrambling occurrence in Hangul Jamo and Compatibity Hangul Jamo. In the case of Hangul Jamo, the number of times and frequency rate in Unicode and UTF-8 were 24times, 52% and 148times, 228% respectively. In the case of Compatibility Hangul Jamo, that were 10times, 14% and 83times, 131% respectively. As a result, when Hangul Jamo and Compatibility Hangul Jamo in UNICODE were transformed to UTF-8, the scrambling frequency rates were increased 340% and 851% respectively.
This paper has studied about the scrambling occurrence frequency in UTF-8 coding system for Unicode Hangul Jamo codes. The scrambling methode applied in the study is HDB-3 in AMI line coding that is international transmission standard. In the study, the source coding rule was applied to analysis the scrambling occurrence. The quantity of the scrambling occurrence was calculated by the number of times and frequency rate of the scrambling occurrence in Hangul Jamo and Compatibity Hangul Jamo. In the case of Hangul Jamo, the number of times and frequency rate in Unicode and UTF-8 were 24times, 52% and 148times, 228% respectively. In the case of Compatibility Hangul Jamo, that were 10times, 14% and 83times, 131% respectively. As a result, when Hangul Jamo and Compatibility Hangul Jamo in UNICODE were transformed to UTF-8, the scrambling frequency rates were increased 340% and 851% respectively.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문은 유니코드 한글낱자 부호와 유니코드 호환용 한글낱자의 부호가 UTF-8부호로 변환될 때 회선부호화과정에서 일어나는 스크램블링 발생에 어떠한 영향을 미치는지를 연구하였다. 한글낱자의 경우에 한글낱자 67개의 자모중에서 스크램블링이 발생하는 횟수는 유니코드에서 24개, UTF-8에서 148개 발생하였다.
가설 설정
UTF-8 부호체계는 1(8비트)~3바이트(24비트)의 3가지 부호체계를 가지고 있다[8],[5],[10]. UTF-8 부호체계는 최상위 숫자가 16진수 E로 시작된다. 표 1은 이 부호체계에 대한 예를 보여주는 것이다.
대상 데이터
회선부호화방식은 RZ(return to zero), NRZ(non return to zero), Manchester, AMI(altenate mark inversion)등이 있다. 본 논문에서는 장거리 통신용 회선부호화방식인 AMI 방식을 연구대상으로 하였다. AMI방식은 원천부호가 회선부호기에 입력될 때 입력되는 부호중에 있는 +성분의 비트(일반적으로 비트 1)를 입력되는 순서대로 +와 -신호로 교대로 생성되게 한다.
한국어의 경우에는 한글 11,161자외에 한글자모들이 부호화되어 있다. 본 논문에서는 한글자모와 호환용 한글 자모를 연구대상으로 하였다. 이 연구대상 한글자모부호에 대한 스크램블링의 빈도를 분석하기 위해 2005년도 국립국어원에서 연구한 한국어 자모통계를 사용하였다[4].
데이터처리
본 논문에서는 한글자모와 호환용 한글 자모를 연구대상으로 하였다. 이 연구대상 한글자모부호에 대한 스크램블링의 빈도를 분석하기 위해 2005년도 국립국어원에서 연구한 한국어 자모통계를 사용하였다[4]. 한글자모부호중에서 스크램블링이 발생하는 자모부호를 분석하기 위해 문자의 원천부호화 규칙을 적용하였다[5].
이론/모형
AMI방식에서 사용하는 스크램블링방식에는 대표적으로 HDB-3방식과 B8ZS방식이 있다[2],[3]. 본 논문에서는 국내외 표준방식인 HDB-3방식을 적용하여 연구하였다. Unicode에는 영어, 한국어, 중국어, 일본어 등 전 세계의 문자가 부호화되어 있다.
이 연구대상 한글자모부호에 대한 스크램블링의 빈도를 분석하기 위해 2005년도 국립국어원에서 연구한 한국어 자모통계를 사용하였다[4]. 한글자모부호중에서 스크램블링이 발생하는 자모부호를 분석하기 위해 문자의 원천부호화 규칙을 적용하였다[5].
성능/효과
이 표에서 빗금 그물표시 부호는 스크램블링이 발생하는 것들이다. 결과적으로 총 256개의 부호에서 63개의 부호가 원천부호화될 때 스크램블링이 발생한다. 그러므로 스크램블링이 발생하지 않는 부호는 총 193개가 된다.
즉, 유니코드를 UTF-8로 변환하면서 스크램블링이 124개가 더 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링이 517% 증가한 것이다. 스크램블링 발생값을 각 자모의 사용 빈도율에 의하여 계산할 경우에 유니코드에서의 스크램블링 발생율은 51.
5% 더 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링이 340% 증가한 것이다.
즉, 유니코드를 UTF-8로 변환하면서 스크램블링이 73개가 더 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링이 730% 증가한 것이다. 스크램블링 발생값을 각 자모의 사용 빈도율에 의하여 계산할 경우에 유니코드에서의 스크램블링 발생율은 13.
5% 더 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링이 851% 증가한 것이다.
결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링이 517% 증가한 것이다. 스크램블링 발생값을 각 자모의 사용 빈도율에 의하여 계산할 경우에 유니코드에서의 스크램블링 발생율은 51.9%, UTF-8은 228.4% 발생하였다. 즉, 유니코드를 UTF-8로 변환하면서 사용 빈도율에 의한 스크램블링이 176.
본 논문은 유니코드 한글낱자 부호와 유니코드 호환용 한글낱자의 부호가 UTF-8부호로 변환될 때 회선부호화과정에서 일어나는 스크램블링 발생에 어떠한 영향을 미치는지를 연구하였다. 한글낱자의 경우에 한글낱자 67개의 자모중에서 스크램블링이 발생하는 횟수는 유니코드에서 24개, UTF-8에서 148개 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생 횟수가 517% 증가한 것이다.
한글낱자의 경우에 한글낱자 67개의 자모중에서 스크램블링이 발생하는 횟수는 유니코드에서 24개, UTF-8에서 148개 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생 횟수가 517% 증가한 것이다. 스크램블링 발생값을 각 자모의 사용 빈도율에 의하여 계산할 경우에 유니코드에서의 스크램블링 발생율은 51.
4% 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생빈도율은 340% 증가하였다. 호환용 한글낱자의 경우에는 호환용 한글낱자 67개의 자모 중에서 스크램블링이 발생하는 횟수는 유니코드에서 10개, UTF-8에서 83개 발생하였다.
결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생빈도율은 340% 증가하였다. 호환용 한글낱자의 경우에는 호환용 한글낱자 67개의 자모 중에서 스크램블링이 발생하는 횟수는 유니코드에서 10개, UTF-8에서 83개 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생횟수는 730% 증가하였다.
호환용 한글낱자의 경우에는 호환용 한글낱자 67개의 자모 중에서 스크램블링이 발생하는 횟수는 유니코드에서 10개, UTF-8에서 83개 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생횟수는 730% 증가하였다.한 것이다. 스크램블링 발생값을 각 자모의 사용 빈도율에 의하여 계산할 경우에 유 니코드에서의 스크램블링 발생 빈도 율은 13.
한 것이다. 스크램블링 발생값을 각 자모의 사용 빈도율에 의하여 계산할 경우에 유 니코드에서의 스크램블링 발생 빈도 율은 13.82%, UTF-8은 131.34% 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생사용빈도율은 851% 증가한 것이다.
34% 발생하였다. 결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생사용빈도율은 851% 증가한 것이다. 이러한 결과가 한글낱자와 호환용한글낱자에서 발생한 것은 유니코드가 UTF-8부호로 변환될 때 가장 많은 스크램블링이 발생하는 유니코드체계 11XX와 31XX로 한글낱자와 호환용 한글낱자부호체계가 되어 있기 때문이었다.
결과적으로 유니코드를 UTF-8로 변환하면서 스크램블링 발생사용빈도율은 851% 증가한 것이다. 이러한 결과가 한글낱자와 호환용한글낱자에서 발생한 것은 유니코드가 UTF-8부호로 변환될 때 가장 많은 스크램블링이 발생하는 유니코드체계 11XX와 31XX로 한글낱자와 호환용 한글낱자부호체계가 되어 있기 때문이었다. 따라서 현재의 유니코드의 한글낱자와 호환용 한글낱자의 부호 배열판을 다른 부호 배열판으로 바꾸지 않는 한 이러한 문제를 해결하는데 큰 어려움이 있을 것으로 분석되었다.
후속연구
이러한 결과가 한글낱자와 호환용한글낱자에서 발생한 것은 유니코드가 UTF-8부호로 변환될 때 가장 많은 스크램블링이 발생하는 유니코드체계 11XX와 31XX로 한글낱자와 호환용 한글낱자부호체계가 되어 있기 때문이었다. 따라서 현재의 유니코드의 한글낱자와 호환용 한글낱자의 부호 배열판을 다른 부호 배열판으로 바꾸지 않는 한 이러한 문제를 해결하는데 큰 어려움이 있을 것으로 분석되었다. 본 연구결과를 토대로 향후 스크램블링이 최소화되는 한글낱자와 호환용 한글낱자의 부호체계의 연구가 필요하다.
따라서 현재의 유니코드의 한글낱자와 호환용 한글낱자의 부호 배열판을 다른 부호 배열판으로 바꾸지 않는 한 이러한 문제를 해결하는데 큰 어려움이 있을 것으로 분석되었다. 본 연구결과를 토대로 향후 스크램블링이 최소화되는 한글낱자와 호환용 한글낱자의 부호체계의 연구가 필요하다. 아울러 유니코드상의 한글글자마디부호체계의 스크램블링 빈도에 대한 연구도 필요하다.
본 연구결과를 토대로 향후 스크램블링이 최소화되는 한글낱자와 호환용 한글낱자의 부호체계의 연구가 필요하다. 아울러 유니코드상의 한글글자마디부호체계의 스크램블링 빈도에 대한 연구도 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
유니코드는 총 몇 개의 문자를 부호화할 수 있는가?
유니코드는 기본 2바이트 16비트체계로 시작되었다. 따라서 총65,536개의 문자를 부호화할 수 있다. 현재의 유니코드 체계는 3.
원천부호화란 무엇인가?
정보기기에서 생성되는 문자의 원천부호체계는 생성된 정보를 통신망에 전송할 때 전송효율에 영향을 미친다. 정보기기에 입력되는 문자를 정해진 비트체계로 표현하는 것을 원천부호화라고 한다. 이 원천부호화는 OSI계층의 6계층, 즉 표현계층에서 실현된다.
Unicode의 경우에는 원천부호가 어떤 부호체계로 변환되는가?
원천문자부호는 회선부호화과정을 거쳐 그대로 통신망에 전송되거나 통신망에 적합한 포맷으로 변환되어 회선부호화된다. Unicode의 경우에는 원천부호가 UTF(universal code system transformation format)부호체계로변환된다. 회선부호화방식은 RZ(return to zero), NRZ(non return to zero), Manchester, AMI(altenate mark inversion)등이 있다.
참고문헌 (13)
B. A. Forouzan, Data communications, New York, NY: McGraw-Hill, 2008.
P. V. Sreekanth, Digital Microwave Communication Systems, Hyderguda, India: Universities press(india) Private Limited, 2003.
P. C. Gupta, Data Communications and Computer Networks, 2nd ed, Delhi, India: PHI Learning Private Limited, 2014.
H. S. Kim, Korean Use Frequency Survey, Seoul, Korea: The National Institute of the Korean Language, 2005.
W. Hong, "Coding rule of characters by 2 bytes with 4x4 bits to improve the transmission efficiency in data communications," The Journal of Korea Navigation Institute, Vol. 15, No. 5, pp. 745-751, Oct. 2011.
J. Alipranda, The Unicode Standard, Boston, MA: Addison Wesley, 2004.
The Unicode Consortium. Components of The Unicode Standard Version 1.0.0 [Internet]. Available: http://www.unicode.org/versions/components-1.0.0.html
F. Yergeau, UTF-8, a Transformation Format of Unicode and ISO 10646, Montreal, Canada: Alis Technologies, 1996.
The Unicode Consortium. UTF-8 encoding table and Unic ode characters page with code points U+1100 to U+11FF. [Internet]. Available: http://www.utf8-chartable.de/unicode-utf8-table.pl?start4352
The Unicode Consortium. UTF-8 encoding table and Un icode characters page with code points U+3100 to U+31FF. [Internet]. Available: http://www.utf8-chartable.de/unicode-utf8-table.pl?start12544
The Unicode Consortium. Components of The Unicode Standard Version 1.0.0 [Internet]. Available: http://www.unicode.org/charts/PDF/U1000.pdf
The Unicode Consortium. Components of The Unicode Standard Version 1.0.0 [Internet]. Available: http://www.unicode.org/charts/PDF/U3000.pdf
The Unicode Consortium. Unicode 7.0.0 Released: 2014 June 16 [Internet]. Available: http://www.unicode.org/versions/Unicode7.0.0/
이 논문을 인용한 문헌
저자의 다른 논문 :
활용도 분석정보
상세보기
다운로드
내보내기
활용도 Top5 논문
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다. 더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.