최신 IT 정보기술 발전에 힘입어 관련 소프트웨어 개발 및 하드웨어 보급이 보편화될수록 IT 기술 활용에 제한적인 사람들은 IT 정보기술 격차를 더욱 크게 느낄 수 있다. 정보통신기기는 일반사용자 이외에도 신체적으로 장애를 가지고 있는 사람들에게 의사소통 및 정보획득을 위한 중요한 수단이 되었다. 또한, 우리나라는 빠르게 고령화사회로 접어들고 있으면서도 장애를 가지는 이들을 위한 대응 제품을 적기에 제시하지 못하고 있다. 특히, 나이가 들어감에 따라 신체적으로 기능이 저하되는 것 가운데 가장 먼저 시각 기능 저하를 들 수 있다. 시각기능 저하로 인해 장애를 겪고 있는 사람들을 위한 정보전달 수단으로 점자책 등이 존재한다. 그러나 일반 서적에 대한 활용과 비교하면 이용 및 활용을 위한 제반 기술이 상당히 부족한 현실이다. 따라서 본 연구에서는 시각기능 저하 혹은 시각장애를 가지는 사람들에게도 일반 서적의 내용을 이해할 수 있도록 리눅스 기반에 소형 스캐너를 부착한 임베디드 시스템 구축에 관한 내용으로서, 문서에 대해 휴대용 스캐너를 활용하여 문자 추출 및 음성으로 변환해주는 통합 시스템에 관하여 살펴본다.
최신 IT 정보기술 발전에 힘입어 관련 소프트웨어 개발 및 하드웨어 보급이 보편화될수록 IT 기술 활용에 제한적인 사람들은 IT 정보기술 격차를 더욱 크게 느낄 수 있다. 정보통신기기는 일반사용자 이외에도 신체적으로 장애를 가지고 있는 사람들에게 의사소통 및 정보획득을 위한 중요한 수단이 되었다. 또한, 우리나라는 빠르게 고령화사회로 접어들고 있으면서도 장애를 가지는 이들을 위한 대응 제품을 적기에 제시하지 못하고 있다. 특히, 나이가 들어감에 따라 신체적으로 기능이 저하되는 것 가운데 가장 먼저 시각 기능 저하를 들 수 있다. 시각기능 저하로 인해 장애를 겪고 있는 사람들을 위한 정보전달 수단으로 점자책 등이 존재한다. 그러나 일반 서적에 대한 활용과 비교하면 이용 및 활용을 위한 제반 기술이 상당히 부족한 현실이다. 따라서 본 연구에서는 시각기능 저하 혹은 시각장애를 가지는 사람들에게도 일반 서적의 내용을 이해할 수 있도록 리눅스 기반에 소형 스캐너를 부착한 임베디드 시스템 구축에 관한 내용으로서, 문서에 대해 휴대용 스캐너를 활용하여 문자 추출 및 음성으로 변환해주는 통합 시스템에 관하여 살펴본다.
According to the development and expansion of software and hardware about recent information technologies(IT), disabled persons in using IT seem to feel more information gap. Devices for IT are important tools for users including disabled persons to communicate with each other and get information. A...
According to the development and expansion of software and hardware about recent information technologies(IT), disabled persons in using IT seem to feel more information gap. Devices for IT are important tools for users including disabled persons to communicate with each other and get information. Although the Korea faces ageing society rapidly, products for disabled persons are seldom shown in time for use. As getting older especially, one of the body function disorders is visual disturbance. There are tools, braille lettering, for disabled persons with visual disturbance to communicate or get information from book. Compared to general books, however, braille lettering book is lack of including all of information of our society. Therefore, in this paper, we implement and show an embedded system for disabled person with visual disturbance to get information by scanning text, extγacting characters and converting the text to speech automatically.
According to the development and expansion of software and hardware about recent information technologies(IT), disabled persons in using IT seem to feel more information gap. Devices for IT are important tools for users including disabled persons to communicate with each other and get information. Although the Korea faces ageing society rapidly, products for disabled persons are seldom shown in time for use. As getting older especially, one of the body function disorders is visual disturbance. There are tools, braille lettering, for disabled persons with visual disturbance to communicate or get information from book. Compared to general books, however, braille lettering book is lack of including all of information of our society. Therefore, in this paper, we implement and show an embedded system for disabled person with visual disturbance to get information by scanning text, extγacting characters and converting the text to speech automatically.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 장에서는 문서-음성 변환 시스템을 구축하기 위해 전체 시스템 구성 및 세부 실제 부품들에 대해 살펴본다.
이에 본 연구에서는 문서-음성 변환 임베디드시스템 구축을 통해 향후 개인 맞춤형 및 신체적 결함을 가지는 사용자를 위한 서비스를 제공할 수 있는 프로토타입을 개발하여 이에 대해 살펴보았다. 다음 그림은 실제 개발된 시스템의 시연을 보이고 있는 모습이다.
그러나 점자책도 정보의 홍수인 현대사회의 정보를 모두 수용하지 못하고 있는 실정이다. 이에 본 연구에서는 시각적 결함을 가지는 사람을 위한 문자 인식후 소리로 들려주는 임베디드 시스템을 개발하여 서비스를 제공하고자한다.
이러한 상황에서 신체적 결함 및 장애를 보완하여 정보 활용을 용이하게 해줄 수 있는 정보통신 제품은 장애인들에게 필수적이다. 이에 본 장에서는 개발한 문서-음성 변환 시스템에 대해 분석 및 설계를 통해 얻을 수 있는 장단점을 살펴보고자 한다.〔1〕
또한, 문자 추출 및 인식 과정을 거쳐서 음성으로 변환하기 위한 음성 합성 기술은 많은 발전을 거듭하여 자연스러운 합성음을 생성할 수 있게 되었다. 이와 같은 제품으로 보이스 텍스트, 매직보잇, 나랏소리, 음성마법사를들 수 있으며, 국외 제품으로 Emacspeak, Festival, VoiceText 등의 오픈 프로젝트 제품들이 있다, 〔4, 5, 6, 10, 11〕이에 본 연구에서도 문자-음성 변환 임베디드 시스템 개발을 위한 분석 설계 및 구축을 단계별로 살펴보도록 한다.
제안 방법
본 연구에서 개발한 문서-음성변환 시스템은 신체 일부에 부착된 스캐너를 이용하여 문서를 스캐닝한다. 스캐닝한 결과로 생성되어진 이미지 문서에서 글자를 추출하여 각 글자에 상응하는 음성으로 시각장애인에게 실시간으로 음성 서비스를 제공할 수 있게 된다.
본 절에서는 개발한 문서-음성 변환 시스템의 분석 및 설계 단계로서, 시스템을 구성하는 전체 구성도를에도시하고 있다.
되도록 만들어졌다. 이 시스템은 모음의 안정 구간을 두 개의 포만트 주파수 즉 Fl, F2를 공진 회로로 모델링 하였으며, 이에 따라 모음에 근사화된 합성음이 생성된다. 1939년 벨 연구소의 Dudley는 분석/합성법을 제안해 음성을 인위적으로 가공할 수 있는 방법을 열어 놓았다.
지금까지 합성은 주로 시간에 따라 변화해가는 음성의 스펙트럼을 n대로 이용하는 방식이었으나 Fant는 '음성이 어떻게 발생되는가'하는 음향 이론(acoustic theory)에 바탕을 둔 발생학적 모델링을 제안했다. 즉 음성의 발생은 여기 신호와 선형 필터로 모델링 (source-filter 반ieory) 할 수 있는데 여기 신호는 유/무성으로, 선형 필터는 입술 구강(oral cavity), 인두강(pharynx cavity)으로 구성된 성도의 공명 효과를 모델링 한다.
대상 데이터
PAT 음성 합성기는 세 개의 공진회로가 병렬로 연결되어 있으며 각 공진기의 출력을 단순히 더하여 합성된다. 이 시스템은 세 개의 포만트 주파수, 유/무성 크기, 기본 주파수 등 6개의 제어 파라미터를 갖는다. OVE Ie 공진회로가 직렬로 연결되고 두 개의 포만트 주파수, 유/무성 크기, 기본 주파수 등의 제어 파라미터로 모음과 같은 음성만 합성한다.
후속연구
본 연구에서 제시하고 있는 문서-음성 변환 시스템은 시각장애인들이 타인의 도움 없이 일반인과 유사하게 일반 문서를 읽을 수 있게 되어 더욱 많은 정보를 손쉽게 획득 할 수 있게 서비스를 제공해주고 있다. 더욱 특징적인 부분은 일반인들이 오히려 어두운 부분에서 책을 판독하기 어렵지만 본 연구의 결과를 응용할 경우 어두운 공간에서도 문서에 대한 판독을 실행할 수 있다.
향후 본 시스템에 대해 휴대성 및 디자인적인 측면이 강조된 연구와 문자 인식률 향상과 음성이 사람과 유사한 음성 출력에 관한 연구를 지속할 것이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.