$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 음성신호의 Jitter 성분의 장시간 변화에 관한 통계적 분석
Statistical analysis on long-term change of jitter component on continuous speech signal 원문보기

말소리와 음성과학 = Phonetics and speech sciences, v.12 no.4, 2020년, pp.73 - 80  

조철우 (창원대학교 전기전자제어공학부)

초록
AI-Helper 아이콘AI-Helper

본 연구에서는 연속음성에서의 장시간 jitter 성분 측정 방법에 대해 고찰하였다. 기존의 jitter측정방법으로는 지속 발성한 모음을 대상으로 변동성을 측정하는 방법을 주로 사용하여왔다. 문장음성 등 연속음성의 경우는 문장에 따른 운율정보의 영향으로 기존의 측정법으로는 왜곡이 발생하게 된다. 이에 연속 발성에 대해 운율정보의 피치 변동을 상쇄시키는 방법을 제안하고자 한다. 피치 변동을 제거하는 방법으로는 분석구간내에서의 피치 변동을 다항식 보간법에 의해 변동 경향을 대표하는 곡선을 구하고 그 곡선을 기준으로 변이를 제거하였다. 이후 변이가 제거된 피치의 궤적으로부터 jitter를 측정하는 방법을 적용하여 피치 주파수의 변동성을 측정하고 기존의 지속모음에 의한 측정 방법과 비교하였다. 제안한 방법의 효용성 측정을 위해 Kay Pentax MEEI DB의 음성 표본을 사용하였다. 통계분석 결과 제안된 방법에 의해 연속음성으로부터 측정한 jitter 값은 동일 화자의 지속모음으로부터 측정한 파라미터 값과 유사한 변동성을 보여 주었다.

Abstract AI-Helper 아이콘AI-Helper

In this study, a method for measuring the jitter component in continuous speech is presented. In the conventional jitter measurement method, pitch variabilities are commonly measured from the sustained vowels. In the case of continuous speech, such as a spoken sentence, distortion occurs with the ex...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구에서는 음원의 불규칙성 측정의 관점에서 지속 모음이 아닌 문장 발성에서의 음성 신호로부터 화자 발성의 주기성에서의 불규칙성을 측정하는 방법과 그 결과에 관하여 고찰하고자 한다.
  • 본 연구에서는 이러한 선행 연구들에 기반하여 문장 내에서 다양한 모음이 존재하는 rainbow speech의 경우 모음 구간을 추출한 뒤에 구간별로 피치의 박동기를 구하고 이를 바탕으로 jitter값을 구할 경우 화자의 음원의 변동성을 일관성있게 나타내줄 수 있다고 보고 문장단위의 피치 변동성 분석을 축소하는 기법을 제안하고 수행하였다.
  • 일반적으로 다항식 보간법에서 적정 보간의 차수를 정하는 방법은 표본의 개수보다 큰 값으로 차수를 정하는 것이 일반적이나 여기서는 전체적인 경향만을 대표하는 곡선을 구하기 위하여 부족 보간이 되도록 포함된 표본의 개수보다 훨씬 적은 값을 차수로 택하도록 하였다. 실험에서는 경험에 의한 선택을 통해 4-7사이의 차수가 적절하였고 그 이상의 차수를 적용하였을 경우 곡선의 굴곡이 심해져 피치 트랙을 추출하고자 하는 목적을 벗어나게 되었다.
  • 각 데이터는 화자별로 동일 화자에 대해 3초간의 지속모음 /ah/와 12초 길이의 rainbow speech가 16 bit, 25 KHz로 표본화되어 녹음되어 있다. 실험에서는 rainbow speech를 분석 대상으로 이용하고 지속모음 /ah/는 화자의 기본 특성을 참조하기 위해 이용하였다.
  • 본 논문에서는 연속발성 문장음성으로부터 피치의 변동성을 측정하기 위하여 다항식 보간에 의한 피치궤적 평탄화 방법을 제안하고 이 방법에 의해 운율 정보가 제거된 피치 궤적으로부터 연속음성의 피치 변동 파라미터를 구하는 과정을 보였다.
  • 또한 제시한 방법을 개선하여 연속발성 문장 음성을 통한 음성의 분석 및 식별에 관한 연구에 적용하고자 한다.

가설 설정

  • 1. 유성음의 구간 길이가 가변적이다.
  • 2. 분석 구간내에서 피치값의 변동이 있다.
  • 3. 때로는 분석 구간에서의 급격한 변동이 있다.
  • 3. 위치정보로부터 문장 전체의 피치값 벡터를 구성한다.
  • 6. 구해진 변동곡선을 원래 트랙으로부터 차감하여 트랙을 평탄화 한다.
  • 차수는 일반적으로 영어 유성음 구간의 길이가 평균 200-300ms라는 것을 참조하고 유성음 구간의 길이가 길어질수록 피치의 변동성이 비례하여 증가할 것이라는 가정하에 경험적으로 설정하였다.
본문요약 정보가 도움이 되었나요?

참고문헌 (10)

  1. Fourcin, A. (2009). Aspects of voice irregularity measurement in connected speech. Folia Phoniatrica et Logopaedica, 61(3), 126-136. 

  2. Gerratt, B. R., Kreiman, J., & Garellek, M. (2016). Comparing measures of voice quality from sustained phonation and continuous speech. Journal of Spech, Language, and Hearing Research, 59(5), 994-1001. 

  3. Kisenwether, J. S, & Prosek, R. A. (2017). Long-term and short-term period and amplitude perturbation measurements: Are they all needed? Annals of Otolaryngology and Rhinology, 4(4), 1172. 

  4. MacCallum, J.K., Zhang, Y., Jiang, J.J. (2011). Vowel selection and its effects on perturbation and nonlinear dynamic measures. Folia Phoniatrica et Logopaedica, 63(2), 88-97. 

  5. Manfredi, C., Giordano, A., Schoentgen, J., Fraj, S., Bocchi, L., & Bejonchkere, P. H. (2011). Perturbation measurements in highly irregular voice signals: Performances/validity of analysis software tools. Biomedical Signal Processing and Control, 7, 409-416. 

  6. Massachusetts Eye and Ear Infirmary. (1994). Voice disorders database (Version 1.03 CD-ROM). Lincoln Park, NJ: Kay Elemetrics. 

  7. Schoentgen, J. (1989). Jitter in sustained vowels and isolated sentences produced by dysphonic speakers. Speech Communication, 8(1), 61-79. 

  8. Schoentgen, J., & Guchteneere, R. (1995). Time series analysis of Jitter. Journal of Phonetics, 23(1), 189-201. 

  9. Teixeira, J.P., & Golcalves, A. (2014). Accuracy of jitter and shimmer measurements. Procedia Technology, 16, 1190-1199. 

  10. Vasilakis, M., & Stylianou, Y. (2009). Voice pathology detection based on short-term jitter estimations in running speech. Folia Phoniatrica et Logopaedica, 61(3), 153-170. 

저자의 다른 논문 :

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로