$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 음성존재확률을 이용한 최적 변형 다채널 위너 필터
An Optimally-Modified Multichannel Wiener Filter Using Speech Presence Probability 원문보기

스마트미디어저널 = Smart media journal, v.7 no.3, 2018년, pp.9 - 15  

정상배 (경상대학교 전자공학과) ,  김영일 (경상대학교 전자공학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 음성존재확률을 이용하여 다채널 위너필터의 이득을 최적으로 변형하는 방법을 제안한다. 기존의 음성존재확률을 이용한 다채널 위너필터의 변형은 다소 경험적인 방법을 사용하기 때문에 잔여잡음의 양을 줄이면 음성왜곡이 증가하는 문제가 있다. 하지만, 제안된 최적 변형 다채널 위너필터는 음성존재확률을 최적 필터를 도출하기 위한 비용함수에 적용하여 비제한적 최소화 문제의 해를 이용하여 잔여잡음의 양과 음성왜곡을 동시에 줄일 수 있는 결과를 보였다. 잡음제거된 파형과 스펙트로그램의 평가를 통해서 제안된 최적 변형 다채널 위너필터가 종래의 다채널 위너필터와 비교하여 향상된 SNR과 음성왜곡을 나타냄을 확인할 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

This paper proposes an optimal gain modification method of the Multichannel Wiener filter (MWF) using speech presence probabilities. Conventional gain modification methods of MWFs have the problem of the increase of speech distortions while reducing residual noises with its relative heuristic approa...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서, 본 논문에서는 음성존재확률을 이용하여 매개변수 내장형 위너필터의 이득을 최적으로 변형하는 방법을 제안하였다. 제안된 최적변형 다채널 위너필터는 확률 기반의 비용 함수를 비제한적 최적화 문제(unconstrained optimization problem)를 풀어서 유도할 수 있다.
  • 본 논문은 음성존재확률을 이용하여 매개변수 내장형 위너필터의 이득을 최적으로 변형시키는 방법에 대해서 제안하였다. 제안한 방법을 분석한 결과 매개변수 내장형 위너필터의 매개변수를 음성존재확률에 따라 자동으로 조절할 수 있는 장점이 있었고, 모의실험을 통해 제안한 방법이 기존 방법 대비 babble 잡음의 경우 SDI가 약 0.
  • 앞서 언급한 음성 존재 확률을 이용한 매개변수 내장형 위너필터의 경험적 이득 조정은 최적이 아니기 때문에 트레이드오프 관계에 있는 음성왜곡과 잔여잡음을 동시에 향상시킬 수가 없다[8]. 위 문제를 해결하기 위해서 본 논문에서는 확률 기반의 비용함수를 제안하고 이 비용함수를 비제한적 최소화 문제로 풀어서 매개변수 내장형 위너필터의 이득을 최적으로 조정하는 방법을 제안한다. 위에서 언급한 비제한적 최적화 문제는 수식 (7)과 같이 표현될 수 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
위너필터란 무엇인가? 이에, 음성을 열화 시키는 잡음의 제거 기술에도 관심이 높아지고 있다. 그 중, 위너필터 (Wiener filter)는 추정된 신호와 원신호간의 차이, 즉 추정 오차를 최소화하는 최적 필터로서 정상성(staitonary) 잡음을 제거하는데 뛰어난 성능을 보인다[3]. 그러나 비정상성(nonstationary) 잡음을 제거하는데 취약하기 때문에 다채널 마이크로폰 배열 신호처리를 위해 다채널로 확장된 위너필터가 제안되었고, 다채널 위너필터(multichannel Wiener filter)는 방향성 잡음과 주변 잡음이 함께 존재하는 열악한 환경에서 기존 단채널 위너필터 보다 향상된 성능을 보인다[4].
음성존재확률을 이용하여 매개변수 내장형 위너필터의 이득을 최적으로 변형시키는 방법의 장점은 무엇인가? 본 논문은 음성존재확률을 이용하여 매개변수 내장형 위너필터의 이득을 최적으로 변형시키는 방법에 대해서 제안하였다. 제안한 방법을 분석한 결과 매개변수 내장형 위너필터의 매개변수를 음성존재확률에 따라 자동으로 조절할 수 있는 장점이 있었고, 모의실험을 통해 제안한 방법이 기존 방법 대비 babble 잡음의 경우 SDI가 약 0.1 dB 감소하면서 NRF가 약 0.2 dB향상시켰고, F-16의 경우 SDI를 약 0.1dB 줄이면서 NRF를 약 0.5 dB 향상시키는 결과 통해 음성강화에서 필연적으로 발생하는 음성왜곡도와 잔여잡음의 양 간에 존재하는 트레이드오프에서 벗어나 두 가지 동시에 향상 시킬 수 있음을 증명하였다.
다채널 위너필터를 일반화 시킨 매개변수 내장형 다채널 위너필터의 장점은 무엇인가? 그러나 비정상성(nonstationary) 잡음을 제거하는데 취약하기 때문에 다채널 마이크로폰 배열 신호처리를 위해 다채널로 확장된 위너필터가 제안되었고, 다채널 위너필터(multichannel Wiener filter)는 방향성 잡음과 주변 잡음이 함께 존재하는 열악한 환경에서 기존 단채널 위너필터 보다 향상된 성능을 보인다[4]. 최근에, 다채널 위너필터를 일반화 시킨 매개변수 내장형 다채널 위너필터(parameterized multichannel Wiener filter)가 음성강화를 위해 제안되었고, 이 방법은 주파수 영역 음성강화 기법으로 잡음제거 성능을 측정하는 중요한 두 가지 기준인 음성 왜곡과 잔여 잡음 간의 트레이드오프 관계를 조절할 수 있는 장점이 있다[4,5]. 매개변수 내장형 위너필터는 음성신호와 잡음의 전력스펙트럼 밀도(power spectral density)와 같은 2차 통계치를 추정하여 구할 수 있으며, 잘 알려진 minimum variance distortionless response (MVDR)도 매개변수 내장형 위너필터의 한 가지 특별한 경우라는 사실이 증명되었다[5].
질의응답 정보가 도움이 되었나요?

참고문헌 (17)

  1. G. Deepak, J.W. Lee, "Comparison of Two Methods for Stationary Incident Detection Based on Background Image," 스마트미디어저널, 제1권, 제3호, 48-55쪽, 2012년 9월 

  2. 이유라, 김수형, 김영철, 나인섭, "심층 학습 모델을 이용한 EPS 동작 신호의 인식," 스마트미디어저널, 제5권, 제3호, 35-41쪽, 2016년 9월 

  3. P.C. Loizou, Speech Enhancement: Theory and Practice. Boca Raton, FL: CRC, pp. 291-394, 2007. 

  4. J. Benety, Microphone Array Signal Processing. Heidelberg, Berlin: Springer-Verlag, pp. 127-214, 2007. 

  5. M. Souden, "On optimal frequency-domain multichannel linear filtering for noise reduction," IEEE Trans. Audio, Speech, Language Process., vol. 18, no. 2, pp. 260-276, 2010. 

  6. N.S. Kim, J.H. Chang, "Spectral enhancement based on global soft decision," IEEE Signal Process. Lett., vol. 7, no. 6, pp. 108-110, 2000. 

  7. I. Cohen, "Optimal speech enhancement under signal presence uncertainty using log-spectral amplitude estimator," IEEE Signal Process. Lett., vol. 9, no. 4, pp. 113-116, 2002. 

  8. M. Souden, "An integrated solution for online multichannel noise tracking and reduction," IEEE Trans. Audio, Speech, Language Process., vol. 19, no. 7, pp. 2159-2169, 2011. 

  9. M. Souden, "Gaussian model-based multichannel speech presence probability," IEEE Trans. Audio, Speech, Language Process., vol. 18, no. 5, pp. 1072-1077, 2010. 

  10. IEEE Subcommittee, "IEEE recommended practice for speech quality measurements," IEEE Trans. Audio Electroacoust., vol. AE-17, no. 3, pp. 225-246, 1969. 

  11. A.P. Varga, "The Noisex-92 study on the effect of additive noise on automatic speech recognition," Tech. Rep. DRA Speech Research Unit, 1992. 

  12. J. Allen, "Image method for efficiently simulating small-room acoustics," J . Acoust. Soc. Amer., vol. 65, pp. 943-950, 1979. 

  13. E. Lehmann, "Prediction of energy decay in room impulse responses simulated with an image-source model," J . Acoust. Soc. Amer., vol. 123, pp. 269-277, 2008. 

  14. J.J. Shynk, "Frequency-domain and multirate adaptive filtering," IEEE Signal Process. Mag., vol. 9, no.1, pp. 15-37, 1992. 

  15. S. Gannot, "Signal enhancement using beamforming and nonstationarity with application to speech," IEEE Trans. Signal Process., vol. 49, no. 8, pp. 1614-1626, 2001. 

  16. S. Affes, "A signal subspace tracking algorithm for microphone array processing of speech," IEEE Trans. Speech, Audio Process., vol. 5, pp. 425-437, 1997. 

  17. J. Chen, "New insights into the noise reduction Wiener filter," IEEE Trans. Audio, Speech, Language Process., vol. 14, no. 4, pp. 1218-1234, 2006. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로