최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기스마트미디어저널 = Smart media journal, v.7 no.3, 2018년, pp.9 - 15
정상배 (경상대학교 전자공학과) , 김영일 (경상대학교 전자공학과)
This paper proposes an optimal gain modification method of the Multichannel Wiener filter (MWF) using speech presence probabilities. Conventional gain modification methods of MWFs have the problem of the increase of speech distortions while reducing residual noises with its relative heuristic approa...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
위너필터란 무엇인가? | 이에, 음성을 열화 시키는 잡음의 제거 기술에도 관심이 높아지고 있다. 그 중, 위너필터 (Wiener filter)는 추정된 신호와 원신호간의 차이, 즉 추정 오차를 최소화하는 최적 필터로서 정상성(staitonary) 잡음을 제거하는데 뛰어난 성능을 보인다[3]. 그러나 비정상성(nonstationary) 잡음을 제거하는데 취약하기 때문에 다채널 마이크로폰 배열 신호처리를 위해 다채널로 확장된 위너필터가 제안되었고, 다채널 위너필터(multichannel Wiener filter)는 방향성 잡음과 주변 잡음이 함께 존재하는 열악한 환경에서 기존 단채널 위너필터 보다 향상된 성능을 보인다[4]. | |
음성존재확률을 이용하여 매개변수 내장형 위너필터의 이득을 최적으로 변형시키는 방법의 장점은 무엇인가? | 본 논문은 음성존재확률을 이용하여 매개변수 내장형 위너필터의 이득을 최적으로 변형시키는 방법에 대해서 제안하였다. 제안한 방법을 분석한 결과 매개변수 내장형 위너필터의 매개변수를 음성존재확률에 따라 자동으로 조절할 수 있는 장점이 있었고, 모의실험을 통해 제안한 방법이 기존 방법 대비 babble 잡음의 경우 SDI가 약 0.1 dB 감소하면서 NRF가 약 0.2 dB향상시켰고, F-16의 경우 SDI를 약 0.1dB 줄이면서 NRF를 약 0.5 dB 향상시키는 결과 통해 음성강화에서 필연적으로 발생하는 음성왜곡도와 잔여잡음의 양 간에 존재하는 트레이드오프에서 벗어나 두 가지 동시에 향상 시킬 수 있음을 증명하였다. | |
다채널 위너필터를 일반화 시킨 매개변수 내장형 다채널 위너필터의 장점은 무엇인가? | 그러나 비정상성(nonstationary) 잡음을 제거하는데 취약하기 때문에 다채널 마이크로폰 배열 신호처리를 위해 다채널로 확장된 위너필터가 제안되었고, 다채널 위너필터(multichannel Wiener filter)는 방향성 잡음과 주변 잡음이 함께 존재하는 열악한 환경에서 기존 단채널 위너필터 보다 향상된 성능을 보인다[4]. 최근에, 다채널 위너필터를 일반화 시킨 매개변수 내장형 다채널 위너필터(parameterized multichannel Wiener filter)가 음성강화를 위해 제안되었고, 이 방법은 주파수 영역 음성강화 기법으로 잡음제거 성능을 측정하는 중요한 두 가지 기준인 음성 왜곡과 잔여 잡음 간의 트레이드오프 관계를 조절할 수 있는 장점이 있다[4,5]. 매개변수 내장형 위너필터는 음성신호와 잡음의 전력스펙트럼 밀도(power spectral density)와 같은 2차 통계치를 추정하여 구할 수 있으며, 잘 알려진 minimum variance distortionless response (MVDR)도 매개변수 내장형 위너필터의 한 가지 특별한 경우라는 사실이 증명되었다[5]. |
P.C. Loizou, Speech Enhancement: Theory and Practice. Boca Raton, FL: CRC, pp. 291-394, 2007.
J. Benety, Microphone Array Signal Processing. Heidelberg, Berlin: Springer-Verlag, pp. 127-214, 2007.
M. Souden, "On optimal frequency-domain multichannel linear filtering for noise reduction," IEEE Trans. Audio, Speech, Language Process., vol. 18, no. 2, pp. 260-276, 2010.
N.S. Kim, J.H. Chang, "Spectral enhancement based on global soft decision," IEEE Signal Process. Lett., vol. 7, no. 6, pp. 108-110, 2000.
I. Cohen, "Optimal speech enhancement under signal presence uncertainty using log-spectral amplitude estimator," IEEE Signal Process. Lett., vol. 9, no. 4, pp. 113-116, 2002.
M. Souden, "An integrated solution for online multichannel noise tracking and reduction," IEEE Trans. Audio, Speech, Language Process., vol. 19, no. 7, pp. 2159-2169, 2011.
M. Souden, "Gaussian model-based multichannel speech presence probability," IEEE Trans. Audio, Speech, Language Process., vol. 18, no. 5, pp. 1072-1077, 2010.
IEEE Subcommittee, "IEEE recommended practice for speech quality measurements," IEEE Trans. Audio Electroacoust., vol. AE-17, no. 3, pp. 225-246, 1969.
A.P. Varga, "The Noisex-92 study on the effect of additive noise on automatic speech recognition," Tech. Rep. DRA Speech Research Unit, 1992.
J. Allen, "Image method for efficiently simulating small-room acoustics," J . Acoust. Soc. Amer., vol. 65, pp. 943-950, 1979.
E. Lehmann, "Prediction of energy decay in room impulse responses simulated with an image-source model," J . Acoust. Soc. Amer., vol. 123, pp. 269-277, 2008.
J.J. Shynk, "Frequency-domain and multirate adaptive filtering," IEEE Signal Process. Mag., vol. 9, no.1, pp. 15-37, 1992.
S. Gannot, "Signal enhancement using beamforming and nonstationarity with application to speech," IEEE Trans. Signal Process., vol. 49, no. 8, pp. 1614-1626, 2001.
S. Affes, "A signal subspace tracking algorithm for microphone array processing of speech," IEEE Trans. Speech, Audio Process., vol. 5, pp. 425-437, 1997.
J. Chen, "New insights into the noise reduction Wiener filter," IEEE Trans. Audio, Speech, Language Process., vol. 14, no. 4, pp. 1218-1234, 2006.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.