$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 한국어 음성합성기용 끊어읽기 추정기
Pause Predictor for Korean Text-to-Speech conversion 원문보기

한국음향학회지= The journal of the acoustical society of Korea, v.17 no.5, 1998년, pp.51 - 56  

이정철 (한국전자통신연구원) ,  김상훈 (한국전자통신연구원) ,  성굉모 (서울대학교 전자공학과)

초록
AI-Helper 아이콘AI-Helper

문장내 휴지구간의 위치와 길이는 합성음의 자연성을 결정짓는 주요 운율 파라미터 중 하나이다. 본 연구에서는 한국어 음성합성기의 합성음 생성에서 자연성 개선을 위해서 문장내 끊어읽기 위치 및 길이를 추정하기 위한 방법을 제안한다. 먼저 실제 발화에서 끊어 읽기가 발생하는 요인을 검토하였다. 그리고 이들 요인에 부합하여 텍스트에 4단계의 끊어 읽기를 표기함으로써 다량의 데이터를 확보하고 이를 이용한 NN 학습 결과와 HMM 추정 기의 성능을 비교 검토한다. 현재까지의 결과로는 NN 학습의 경우 끊어읽기 없는 경우와 긴 끊어읽기의 추정에서는 우수한 예측능력을 보이지만 짧은 끊어읽기, 중간 끊어읽기의 경 우는 HMM의 성능이 우수한 것으로 판명되었다. 전반적인 성능에서는 HMM이 우수하며 끊어읽기 종류에 따라 추정오차가 10∼25%로서 안정적인 결과를 얻었으며 TTS에의 활용 가능성을 보였다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구에서는 이에 대한 대안으로서 먼저 실제 발화에서 끊어읽기가 발생하는 요인을 검토하였다. 그리고 이들 요인에 부합하여 안정되게 끊어읽기를 하는 사람이 텍스트에 끊어읽기를 표기하여 다량의 데이터를 확보하였다.
  • •음운환경과 사회적 관습 (표준어) 의해 기본이 결정되지만 구내 단어간 결합관계에 의해 변화된다. 본 연구에서는 의미구조, 화자의 의도 발화속도와 같은 언어 외적인 요인은 배제하고 구문구조, 단어간 품사 결합 현상 등의 요인을 문장의 끟어읽기에 영향을 미치는 것으로 국한한다. 이 경우 문장내 어절의 품사열과 률적 끊어읽기 분포도를 입력으로 한 NN학습 혹-은 HMM을 이용하여 끊어읽기 위치 및 길이의 추정이 가능함을알 수 있다[10-13].
  • 이 경우 문장내 어절의 품사열과 률적 끊어읽기 분포도를 입력으로 한 NN학습 혹-은 HMM을 이용하여 끊어읽기 위치 및 길이의 추정이 가능함을알 수 있다[10-13]. 그러므로 여기서는 이들 요인을 기준으로 하여 문장의 끊어읽기 추정기를 작성하고, 8,693 문장의 텍스트 데이타에 수작업으로 기록한 끊어읽기 정보를 대상으로 NN학습과 HMM추정결과를 비교 검토하여 음성합성기에 활용, 합성음의 자연성을 개선하고자 한다.
  • 또 문형, 문장의 길이, 의미구조, 구문구조, 화자의 의도 발화속도에 따라 끊어읽기가 달라지므로 실제 발화에서 나타나는 끊어읽기와 수작업 결과가 일치하지 않는단점이 있지만 이들 문제를 통계적 분석방법으로 해소하고자 한다. 표 1에 대표적 품사별 끊어읽기 종류에 따른빈도를 나타내었다.
  • NN을 학습하는데 있어서 그 목적은 입력된 품사열 정보를 이용하여 target 어절 뒤에 올 juncture type을 예측하는데 있다. 이 목적을 위해서 방법 1에서는 연속되는 5

가설 설정

  • 그리고 이들 요인에 부합하여 안정되게 끊어읽기를 하는 사람이 텍스트에 끊어읽기를 표기하여 다량의 데이터를 확보하였다.이를 위해서 우리는 다음을 가정하였다. 발성자가 자신의의사를 표현하고자 할 때 먼저 의미구조를 형성하고, 이를 전달하기에 적합한 단어들을 선택하며, 단어들의 연결이 자연스러운 구문구조를 작성한 뒤, 조음기관을 이용하여 음절단위로 발성하며 조음기관의 물리적 제약을 받게된다.
  • 숨쉬기는 문장, 절, 분리도가 높은 구의 경계에서 일어난다.
  • 자연스러운 숨쉬기는 그 의미적 경계가 뚜렷한 경우를 기준하여 일어난다.
  • 음운환경과 사회적 관습 (표준어) 의해 기본이 결정되지만 구내 단어간 결합관계에 의해 변화된다. 본 연구에서는 의미구조, 화자의 의도 발화속도와 같은 언어 외적인 요인은 배제하고 구문구조, 단어간 품사 결합 현상 등의 요인을 문장의 끟어읽기에 영향을 미치는 것으로 국한한다.
  • 어절과 어절사이에 끊어읽기가 존재한다고 가정한다. 끊어읽기 유형은 단순하게는 NB (no break), B (break)의2가지로 둘 수 있으며, NB, SB, MB, LB의 4가지 혹은그 이상으로 둘 수 있다.
본문요약 정보가 도움이 되었나요?

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로