$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

쉰목소리 완화를 위한 주파수 영역 음성 강조 필터 설계
Voice Boosting Filter Design in Frequency Domain for Relief of Husky Voice 원문보기

멀티미디어학회논문지 = Journal of Korea Multimedia Society, v.19 no.12, 2016년, pp.1919 - 1926  

김현태 (Dept. of Multimedia Eng., Dongeui University) ,  이상협 (Dept. of Digital Media Eng., Graduate School, Dongeui University)

Abstract AI-Helper 아이콘AI-Helper

The people who complain of pain due to voice causes such as vocal cord nodules is increasing year by year. If the voice is changed, it is possible to give to colleagues discomfort or inconvenience during conversation. In this paper, we propose a way to reduce discomfort by improving the husky voice ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 또한 쉰 목소리와 정상 목소리간의 차별성을 갖는 다양한 음성 특징 성분들이 있지만 쉰 목소리의 스펙트럼이 정상 목소리의 스펙트럼에 비해 포만트 성분이 상대적으로 뚜렷하지 못한 특성을 보이는 것도 그 중 한 가지에 해당한다. 본 논문에서는 이러한 특성을 개선하기 위해 스펙트럼 영역에서 포만트 성분을 보다 강조하는 필터를 제안하고 실시간 처리를 위해 고속 디지털 신호처리 보드에 구현한다. 포만트 성분 강조 필터는 1차원 라플라스 연산자와 가우스 함수를 동시에 사용하여 설계하고 실시간 처리를 위해 TMS320F2812 디지털 신호처리 전용 모듈에 구현하였다.
  • 본 논문은 두 번째 접근법과 관련되며, 쉰 목소리에 포함된 쉰 소리 성분을 잡음과 유사한 성분으로 간주하여 잡음 성분에 대해 순수 목소리 성분을 상대적으로 강조하거나 순수 목소리 성분과 잡음 성분을 분리하면 쉰 목소리를 보다 개선할 수 있다는 생각에서 제안하였다.
  • 이들은 지인들과 전화 통화나 대화 시 상대방의 반응 등으로 심리적인 어려움을 겪고 있고 심지어 대화를 기피하는 증세도 나타나고 있다. 이들의 이러한 2차 고통을 조금이나마 완화시켜주기 위해 본 연구를 시도하였다. 쉰 목소리 성분에 포함된 잡음도 일종의 주변 잡음과 유사하다는 판단 하에 잡음 속에 섞여있는 음성 성분을 보다 강조하는 필터를 설계하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
국민건강보험공단 자료에 따르면, 2013년 한해 동안 몇명의 인원이 성대결절로 병원을 방문하였는가? 국민건강보험공단 자료에 따르면, 2013년 한해 9만7천438명이 성대결절(질병코드 J38.2)로 병원을 찾았으며 매년 조금씩 증가하는 추세를 보인다고 한다.
쉬프트 연산을 통해 원래의 주파수 위치로 옮기는 이유는? 컨볼루션 연산을 통해 얻어진 출력 데이터는 필터 길이에 의해 일정수 만큼 주파수 위치가 이동하기 때문에 쉬프트 연산을 통해 원래의 주파수 위치로 옮긴다.
라플라스 연산자를 적용하기 전에 가우스 함수와 같은 스무딩 필터를 보통 적용하려는 이유는? 라플라스 연산자는 이미지내에서 밝기 값이 급격한 변화를 보이는 영역을 찾는데 사용되는 미분 연산자이다. 그러나 미분 연산이기 때문에 잡음에 매우 민감하다. 따라서 라플라스 연산자를 적용하기 전에 가우스 함수와 같은 스무딩 필터를 보통 적용한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (10)

  1. 2013 National Health Insurance Statistical Yearbook in Korea, 2014. (Health Insurance Review & Assessment Service, Gangwon-Do 26465, Korea) 

  2. S. Han, S. Kim, J. Kim, and C. Kwon, "A Preliminary Study on Correlation between Voice Characteristics and Speech Features," Journal of the Korean Society of Speech Sciences, Vol. 3, No. 4, pp. 85-91, 2011. 

  3. D.Y. Choi, S.M. Choi, G.C. Lim, and S.Y. Nam, "Usefulness of Voice Handicap Index in Patients with Hoarseness," Korean Journal of Otorhinolaryngology-Head and Neck Surgery, Vol. 45, No. 7, pp. 706-10, 2002. 

  4. W. Lee, S. Wang, K. Chon, S. Kwon, K. Jeon, S. Kim, et al., "Laryngeal Cancer Screening using Cepstral Parameters," The Journal of the Korean Society of Logopedics and Phoniatrics, Vol. 14, No. 2, pp. 110-116, 2003. 

  5. H. Kim, Y. Chung, and K. Bae, "A Robust Speech Recognition Method Combining the Model Compensation Method with the Speech Enhancement Algorithm," Speech Sciences, Vol. 14, No. 2, pp. 115-126, 2007. 

  6. G. Lee, J.H. Lee, J. Cho, and M.N. Kim, "Adaptive Noise Canceller for Speech Enhancement Using 2-D Binary Mask," Journal of The Korean Multimedia Society, Vol. 19, No. 7, pp. 1127-1136, 2016. 

  7. LoG Filter, http://academic.mu.edu/phys/ matthysd/web226/Lab02.htm, (accessed Jul., 4, 2016). 

  8. R.L. Joshi and T.R. Fischer, "Comparison of Generalized Gaussian and Laplacian Modeling in DCT Image Coding," IEEE Signal Processing Letters, Vol. 2, Issue 5, pp. 81-82, 1995. 

  9. J. Choi, "Formant Enhancement Algorithm of Speech Using Auditory Filter," Journal of Korean Institute of Information Technology, Vol. 11, No. 7, pp. 173-178, 2013. 

  10. TMS320F2812 Digital Signal Processors Data Manual, Texas Instruments, Literature Number: SPRS174T April 2001-Revised May 2012. 

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로