$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"
쳇봇 이모티콘
안녕하세요!
ScienceON 챗봇입니다.
궁금한 것은 저에게 물어봐주세요.

논문 상세정보

TTS 적용을 위한 음성합성엔진

Speech syntheis engine for TTS

초록

본 논문은 컴퓨터에 입력된 문자정보를 음성정보로 변환하기 위한 음성합성엔진에 관한 것이며, 특히 명료성의 향상을 위해 파형처리 음성합성방식을 이용한다. 음성합성엔진은 컴맨드 스트림의 제어에 따라 자연성의 향상을 위한 피치조절, 길이 및 에너지 등을 제어하며 음성합성단위로서 반음절을 사용한다. 엔진에서 사용 가능한 컴맨드를 프로그램하여 음성합성엔진에 입력함으로서 음성을 합성하는 빙식은 구문분석, 어휘분석 등의 하이레벨과 파형의 편집 가공 등의 로우레벨을 완전 분리하므로 시스템의 융통성과 확장성을 높인다. 또한 TTS시스템의 적용에 있어 각 모듈을 객체/컴포넌트(Object/Component)로 각 모듈이 상호 독립적으로 작동되도록 하여 쉽게 대체가 가능하다. 하이 레벨과 로우 레벨을 분리하는 소프트웨어 아키택처는 음성합성 연구에 있어 각각 여러 분야별로 독립적으로 연구수행이 가능하여 연구의 효율성을 높이며 여러 소프트웨어의 조합사용(Mix-and-Match)이 가능하여 확장성과 이식성을 향상시킨다.

Abstract

This paper presents the speech synthesis engine that converts the character strings kept in a computer memory into the synthesized speech sounds with enhancing the intelligibility and the naturalness by adapting the waveform processing method. The speech engine using demisyllable speech segments receives command streams for pitch modification, duration and energy control. The command based engine isolates the high level processing of text normalization, letter-to-sound and the lexical analysis and the low level processing of signal filtering and pitch processing. The TTS(Text-to-Speech) system implemented by using the speech synthesis engine has three independent object modules of the Text-Normalizer, the Commander and the said Speech Synthesis Engine those of which are easily replaced by other compatible modules. The architecture separating the high level and the low level processing has the advantage of the expandibility and the portability because of the mix-and-match nature.

저자의 다른 논문

참고문헌 (11)

  1. Cordon E. Pelton , Voice Processing / v.,pp.13-32, 1993
  2. Pitch-Synchronous Waveform Processing Techniques for Text-to-Speech Synthesis Using Diphones , E. Moulines;F.J. Charpentier , Speech Communication / v.9,pp.453-467, 1990
  3. Diphone Synthesis Using An Overlap-Add Technique for Speech WaveForms Concattenation , F.J. Carpentier;M.G. Stella , Proc. ICASSP / v.,pp.2015-2018, 1986
  4. TTS Algorithms Based on FFT Synthesis , F.J. Carpentier;E. Mouliens , ICASSP / v.,pp.667-670, 1988
  5. MBR-PSOLA: Text-to-Synthesis Based On FFT An MBE Re-Synthesis of the Segments Data- base , Thierry Dutoit;Henri Leich , Speech Communication / v.12,pp., 1993
  6. 운율 및 길이 정보를 이용한 무제한 음성합성기의 설계 및 구현 , 양진석;김재범;이정현 , 한국정보처리학회 논문지 / v.3,pp.1121-1129, 1996
  7. 음성인식/합성을 위한국어의 음성-음운론적 특성연구 , 정국;구희산;이찬도;김종미 , 한국음향학회지 / v.13,pp.31-43, 1994
  8. 합성음성평가를 위한 다음절 무의미 단어 생성과 이용에 관한 연구 , 조철우;김경태;이용주 , 한국음향학회지 / v.13,pp.51-58, 1994
  9. 음소단위를 이용한 소규모 문자음성변환 시스템의 설계 및 구현 , 박애희;양진우;김순협 , 한국음향학회지 / v.14,pp.49-60, 1995
  10. Effects of Glottal pulse Shape on the Quality of Natual Vowels , A. Rosenberg , J. Acost. Soc. Am / v.,pp.583-590, 1970
  11. A Theoretical Study of the effects of the various Laryngeal Configurations on the Acoustics of Phon- ation , I. Titze;D. Talkin , J. Acoust. Soc. Am. / v.,pp.60-74, 1974

이 논문을 인용한 문헌 (1)

  1. 이희만, 김지영 2000. "인터넷 웹페이지의 음성합성을 위한 엔진 및 플러그-인 설계 및 구현" 정보처리논문지 = The transactions of the Korea Information Processing Society, 7(2): 461~469 

원문보기

원문 PDF 다운로드

  • ScienceON :

원문 URL 링크

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

이 논문 조회수 및 차트

  • 상단의 제목을 클릭 시 조회수 및 차트가 조회됩니다.

DOI 인용 스타일

"" 핵심어 질의응답