$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

노인음성신호처리에서의 젠더 분석
Gender Analysis in Elderly Speech Signal Processing 원문보기

디지털융복합연구 = Journal of digital convergence, v.16 no.10, 2018년, pp.351 - 356  

이지연 (중원대학교 생체의공학과)

초록
AI-Helper 아이콘AI-Helper

화로 인한 성대의 변화는 음성의 주파수를 변화시킬 수 있으며, 그 노인음성 신호는 다양한 분석을 통해 정상음성 신호와 자동으로 구분할 수 있다. 본 연구의 목적은 기존 스마트 의료 시스템의 노령자 음성 인식 성능을 향상시키고, 음성을 이용한 편리한 인터페이스를 제공함으로써 빠르게 변화하고 있는 기술사회에서 제외될 수 있는 노인과 장애인들에게 쉽게 접근 할 수 있는 도구를 제공하는 것이다. 본 연구에서는 성 분석으로서, 연구 대상의 성별을 보고했고, 여성과 남성 음성 샘플 개수를 동일하게 사용하였다. 또한 젠더 분석을 적용하여 모든 연령의 목소리를 사용하지 않고 노령자의 목소리를 목표로 설정하여 실험을 수행하였다. 마지막으로, 우리는 성별 및 젠더 편견을 줄이기 위한 표준 및 참조 모델의 재검토 방법을 적용하였다. 본 연구에서는 70세에서 80세까지의 한국인 여성 10명과 남성 10명의 노령자 음성을 사용했다. 파형을 보고 직접 추출한 F0 값과 TF32와 Wavesufer 음성 분석 프로그램에서 추출된 F0를 비교했을 때, TF32보다 Wavesufer가 노인음성의 F0를 더 잘 분석하는 것을 알 수 있었다. 그러나 노령자 대상 노인음성용 음성분석프로그램이 필요하며, 노령자의 음성을 분석함으로써 기존 스마트 의료 시스템의 음성 인식 및 합성 성능을 향상시킬 수 있을 것으로 기대한다.

Abstract AI-Helper 아이콘AI-Helper

Changes in vocal cords due to aging can change the frequency of speech, and the speech signals of the elderly can be automatically distinguished from normal speech signals through various analyzes. The purpose of this study is to provide a tool that can be easily accessed by the elderly and disabled...

주제어

표/그림 (3)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구는 노령자의 음성을 분석함으로써 기존 스마트 의료 시스템의 음성 인식 및 합성 성능을 향상시킬 것이다. 이것은 또한 빠른 사회화에서 제외 된 노인 및 장애인에게 음성과 같은 쉬운 접근 수단을 제공하여 많은 기기를 다루는데 도움이 될 것으로 기대한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
현재 음성 인터페이스는 어떠한 상황인가? 의료 복지 시스템을 위해 음성 인터페이스를 갖춘 스마트 디바이스가 활발하게 개발되고 있지만 대부분의 의료 기기의 경우 고령자를 고려하지 않은 인터페이스로 인해 음성 인식 및 합성시스템의 성능이 하락되는 경향을 보인다[1,2]. 현재 음성 인터페이스는 청년, 중년 및 고령자의 평균 음성 패턴을 기반으로 한 최적화 된 방법을 사용하기 때문에 표준에서 조금 벗어난 경우 음성 합성 및 인식 성능이 저하 될 수 있다[2,3]. 따라서 노인음성신호처리 연구가 필요하다.
노인의 목소리 분석으로 무엇을 가능케 하는가? 결론적으로, 노인의 목소리는 유아, 청소년, 젊은 성인, 중년의 목소리 등과 구별할 수 있다. 노인의 목소리 분석은 젠더 분석의 시작이 될 수 있다.
파라미터를 이용한 음향 분석은 노인 신호 분석에 어떠하다고 평가받는가? 노인 신호와 관련된 많은 연구가 발표되었지만 Jitter(%) 및 Shimmer(%) 파라미터를 이용한 음향 분석에 기반을 두고 있다[3, 5-7]. 그러나 이 파라미터들은 기본 주파수(F0)에 기반하고 있기 때문에, 노인 신호의 비주기성을 측정하기 위해서는 매우 신뢰성 있는 피치 검출 알고리즘이 필요하다 [8,9]. 최근 Lee는 한국 노인 신호에 대한 객관적이고 신뢰할 수 있는 샘플 선택 방법으로써 이동 윈도우 방법(Moving window method)을 제안했다. Jitter(%) 및 Shimmer(%) 및 신호 대 잡음비(Signal to noise ratio, SNR (dB))의 최소 perturbation 값을 활용했다.
질의응답 정보가 도움이 되었나요?

참고문헌 (21)

  1. J. Lee. (2014). KHIDI Brief. Korea Health Industry Development Institute. 140(2014), 1-2. 

  2. J. I. Yi, Y. K. Kim & G. J. Kim. (2017). A Study on Improving English Pronunciation and Intonation utilizing Fluency Improvement system, Journal of the Korea Convergence Society, 8(11), 1-6. 

  3. J. C. Hwang. (2017). Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution, Journal of the Korea Convergence Society, 8(5), 13-17. 

  4. J. C. Kahane. (1981). Anatomic and physiologic changes in the aging peripheral speech mechanism, Edited D. S. Beasley & G. A. Davis, Grune & Stratton, New York, 21-45. 

  5. S. Y. Lee. (2011). The overall speaking rate and articulation rate of normal elderly people, Graduate program in speech and language pathology, Master these, Yonsei University. 

  6. R. T. Sataloff, D. C. Rogen, M. Hawkshaw & J. R. Spiegel. (1997). The three ages of voice. The aging adult voice, Journal of Voice, 11(2), 156-160. 

  7. S. Lee & S. Kim. (2014). Elderly speech analysis for improving elderly speech recognition, Communications of the KOREA Information Science Society, 32(11), 15-20. 

  8. J. Y. Lee & S. H. Choi. (2012). Perturbation analysis using a moving window for disordered voices, International Journal of Engineering, Science, and Innovative Technology, 3(1), 1-10. 

  9. J. Y. Lee. (2016). Fundamental Frequency Characteristics using Moving Window Method for Korean Elderly Voices, International Journal of Engineering and Technology, 8(3), 1589-1599. 

  10. J. B. Alonso, J. de Leon, I. Alonso & M. A. Ferrer. (2001). Automatic Detection of Pathologies in the Voice by HOS Based Parameters, EURASIP Journal on Applied Signal Processing, 4(2001), 275-284. 

  11. J. Y. Lee, S. Jeong & M. S. Hahn. (2008). Pathological Voice Detection Using Efficient Combination of Heterogeneous Features, IEICE Transactions on Information and Systems, E91-D(2), 367-370. 

  12. J. Y. Lee, S. Jeong, H. S. Choi & M. S. Hahn. (2008). Objective pathological voice quality assessment based on HOS features, IEICE Transactions on Information and Systems, E91-D(12), 2888-2891. 

  13. J. Y. Lee. (2012). A two-stage approach using Gaussian mixture models and higher-order statistics for a classification of normal and pathological voices, Advances in Signal Processing on Euraship, 252(2012). http://asp.eurasipjournals.com/content/2012/1/252. 

  14. J. Y. Lee, S. B. Jeong, M. S. Hahn, A. Sprecher & J. J. Jiang. (2011). An efficient approach using HOS-based parameters in the LPC residual domain to classify breathy and rough voices, Biomedical Signal Processing and Control, 6(2), 186-196. 

  15. J. Y. Lee. (2017). Feature Extraction of Elderly Signals based on Bicoherence Estimation for Automated Medical Diagnosis System, International Journal of Control and Automation, 10(2), 115-128. http//dx.doi.org/10.14257/ijca.2017.10.2.10 

  16. KOFWST, Gendered Innovations, http://gister.re.kr/#!/main 

  17. WISET (2013). Science and Technology Gender Innovation. Seoul : WISET. ISBN 978-89-97520-24-4 

  18. H. T. Kim, S. H. Cho, S. M. Youn, D. I. Sun & M. S. Kim. (2000). The Changes and Characteristics of Acoustic Parameters with Aging in Korean, Korean J Otolaryngol, 2000(43), 69-74. 

  19. S. W. Kim, H. H. Park, E. S. Park & H. S. Choi. (2010). Acoustic Characteristics of Normal Healthy Koreans with Advancing age, Phonetics and Speech Sciences, 2(4), 19-28. 

  20. P. H. Milenkovic. University of Wisconsin-Madison http://userpages.chorus.net/cspeech/ 

  21. https://en.wikipedia.org/wiki/WaveSurfer 

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로