$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

공간 필터와 결합된 음성 왜곡 가중 다채널 위너 필터에서의 신호 대 잡음 비에 의한 가중치 결정 방법
SNR-based Weight Control for the Spatially Preprocessed Speech Distortion Weighted Multi-channel Wiener Filtering 원문보기

방송공학회논문지 = Journal of broadcast engineering, v.18 no.3, 2013년, pp.455 - 462  

김기백 (숭실대학교 전기공학부)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 여러 개의 마이크를 이용하여 잡음을 제거하는 방법인 공간 필터로 전처리된 신호를 입력으로 하는 음성 왜곡 가중 다채널 위너 필터 (Spatially Preprocessed Speech Distortion Weighted Multi-channel Wiener Filter: SP-SDW-MWF)에 대해 소개하고, 가중치를 결정하는 방법을 제안한다. SP-SDW-MWF는 마이크로폰 어레이를 이용한 잡음 제거 알고리즘으로서 마이크로폰 불일치와 같은 오차에 강인한 것으로 알려져 있다. SP-SDW-MWF는 필터 계수를 최적화할 때 음성 왜곡과 잡음 제거에 대한 기준으로 나누어 가중치를 두고 있다. 이러한 가중치를 결정하기 위해, 본 논문에서는 전력 스펙트럼 밀도 오차를 평가 척도로 사용하여 마이크로폰으로부터 입력된 음성 신호와 잡음의 전력 스펙트럼 밀도의 비 (a priori SNR)를 이용하는 방법을 제안한다. 실험결과에서 나타난 바와 같이 a priori SNR에 따라 가변적인 가중치를 사용하는 것이 고정된 값을 가중치로 사용하는 것보다 향상된 성능을 보임을 알 수 있다.

Abstract AI-Helper 아이콘AI-Helper

This paper introduces the Spatially Preprocessed Speech Distortion Weighted Multi-channel Wiener Filter (SP-SDW-MWF) for multi-microphone noise reduction and proposes a method to determine the speech distortion weights. The SP-SDW-MWF is known as a robust noise reduction algorithm against the error ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • SP-SDW-MWF의 출력 신호와 원하는 신호의 전력 스펙트럼 오차를 유도하여 가중치와 a priori SNR과의 관계를 알아보기로 한다. 시스템의 출력 신호는 다음과 같이 입력 신호와 필터 계수로 표현할 수 있다.
  • 본 논문에서는 SP-SDW-MWF를 이용한 어레이 마이크로폰 잡음 제거 시스템에서 음성 왜곡 가중치를 결정하는 방법을 제안하였다. 시스템의 출력 신호와 목적 신호의 전력 스펙트럼 밀도 오차로 성능을 평가하는 경우, 가중치는 a priori SNR에 따라 다른 값을 가져야 함을 보였다.
  • 본 논문에서는 목적 신호와 추정 신호간의 전력 스펙트럼의 차이를 유사도 측정의 기준으로 하는 경우 음성 왜곡 가중치를 결정하는 방법을 제안하고자 한다. 전력 스펙트럼은 음성 신호의 특성을 나타내는 중요한 척도가 되며, 기존의 단일 마이크 잡음 제거 필터 추정에서도 전력 스펙트럼 오차를 최소화하는 방법이 널리 사용되었다[3,4].
  • 3~4초 정도 길이의 음성데이터 20개를 입력으로 넣고 SNR이 0 dB가 되도록 잡음의 크기를 조정하였다. 본 실험에서는 여러 음성 신호처리에서 특징벡터로 널리 사용되는 MFCC (Mel-Frequency Cepstral Coefficient)의 거리를 평가척도로 하였다. MFCC의 차수는 음성인식에서 흔히 쓰이는 13차로 하였다.
  • SP-SDW-MWF는 그림 1과 같이 GSC와 SDW-MWF의 결합으로 나타낼 수 있다. 본 장에서는 GSC와 SDW-MWF에 대해 각각 알아보고, 이 두 알고리즘의 결합인 SP-SDW-MWF에 대해 설명하고자 한다.

가설 설정

  • M채널 전달함수 H는 전력 스펙트럼 밀도의 손실이 없다고 가정하였다. 식(25)에서 보듯이 전력 스펙트럼의 오차는 a priori SNR을 나타내는 γ, 음성 왜곡 가중치를 나타내는 µ, 음성 신호의 공간 전달 함수를 나타내는 H, 그리고 잡음의 공간적 특성을 나타내는 코히어런스 행렬 Γn에 의해 결정된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
마이크로폰 어레이를 이용하는 잡음 제거 알고리즘에는 무엇이 있는가? 하나의 마이크로폰을 사용하는 경우는 음성과 잡음의 시간-주파수 영역의 정보만 이용하는 반면, 여러 개의 마이크로폰을 이용하는 경우는 신호의 공간적인 정보를 이용하여 필터링하므로 음성 왜곡을 최소화하면서도 높은 잡음 제거 성능을 얻을 수 있게 된다. 마이크로폰 어레이를 이용하는 잡음 제거 알고리즘으 로는 고정 빔포밍 (Fixed beamforming), 적응 빔포밍 (Adaptive beamforming), 포스트 필터링 (Post-filtering), 그리고 다채널 위너 필터링 (Multi-channel Wiener filtering) 등이 있다[7]. 최근 몇 년 동안 다채널 위너 필터링에 관한 연구가 많이 이루어졌는데 GSVD (Generalized Singular Value Decomposition), QR 분해 등을 이용한 구현 방법들이 제안되었다[8,9].
GSC는 무엇인가? GSC는 고정 빔포머로부터 음성 신호의 레퍼런스를 만들 고, 이 신호를 입력으로 하는 적응 필터를 이용하여 잡음 성분을 제거하는 시스템이다[11]. 먼저 M개의 마이크로폰 신호에 대해 적절한 시간 지연을 줌으로써 모든 마이크로 폰들이 음성 신호가 위치한 방향으로 향하게 한다.
SP-SDW-MWF는 음성 성분의 왜곡과 잡음 제거 정도를 가중치를 두어 조절할 수 있는데 이로 인해 어떤 이점을 얻을 수 있는가? 또한 이 방법은 음성 성분의 왜곡과 잡음 제거 정도를 가중치를 두어 조절할 수 있다. 목적 신호와 추정 신호 간의 최소 자승 오차 (Mean Squared Error: MSE)가 성능 판단의 기준이 될 때는 이러한 가중치가 필요없지만, 음성의 명료도 (intelligibility)의 향상, SNR향상, 전력 스펙트럼 밀도 오차의 최소화 등의 다른 여러 가지 성능을 측정할 때는 적절한 음성 왜곡 가중치를 사용하여 성능 향상을 도모할 수 있다. 가중치는 평가 척도에 따라 고정된 가중치를 사용할 수도 있으나, 시간, 주파수에 따라 가변적인 가중치를 사용할 수도 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (14)

  1. J. S. Lim and a. V. Oppenheim, "Enhancement and bandwidth compression of noisy speech," Proceedings of the IEEE, vol. 67, no. 12, pp. 1586-1604, 1979. 

  2. S. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. ASSP-27, no. 2, pp. 113-120, 1979. 

  3. Y. Ephraim and D. Malah, "Speech enhancement using a minimum- mean square error short-time spectral amplitude estimator," IEEE Trans. on Acoustics, Speech, and Signal Processing, vol. ASSP-32, no. 6, pp. 1109-1121, 1984. 

  4. Y. Ephraim and H. Van Trees, "A signal subspace approach for speech enhancement," IEEE Trans. on Speech and Audio Processing, vol. 3, no. 4, pp. 251-266, 1995. 

  5. J. Huang and Y. Zhao, "An energy-constrained signal subspace method for speech enhancement and recognition in white and colored noises," Speech Communication, vol. 26, no. 3, pp. 165-181, Nov. 1998. 

  6. K. Hermus, P. Wambacq, and H. Hamme, "A Review of Signal Subspace Speech Enhancement and Its Application to Noise Robust Speech Recognition," EURASIP Journal on Advances in Signal Processing, vol. 2007, no. 1, p. 045821, 2007. 

  7. M. Brandstein and D. Ward (Eds.), Microphone Arrays, Springer-Verlag, 2001. 

  8. S. Doclo and M. Moonen, "GSVD-based optimal filtering for multimicrophone speech enhancement," IEEE Trans. on Signal Processing, vol. 50, no. 9, pp. 2230-2244, Sep. 2002. 

  9. G. Rombouts and M. Moonen, "QRD-based unconstrained optimal filtering for acoustic noise reduction," Signal Processing, vol. 83, no. 9, pp. 1889-1904, Sep. 2003. 

  10. A. Spriet, M. Moonen, and J. Wouters, "Spatially preprocessed speech distortion weighted multi-channel Wiener filtering for noise reduction," Signal Processing, vol. 84, no. 12, pp. 2367-2387, Dec. 2004. 

  11. L. Griffiths and C. Jim, "An alternative approach to linearly constrained adaptive beamforming," IEEE Trans. Antennas Propagation, vol. AP-30, no. 1, pp. 27-34, Jan. 1982. 

  12. J. Benesty, S. Makino, J. Chen (Eds.), Speech Enhancement, Springer, 2005. 

  13. L. Rabiner and B.-H. Juang, Fundamentals of Speech Recognition, Prentice-Hall, 1993. 

  14. J. Allen and D. Berkely, "Image method for efficiently simulating small-room acoustics," Journal of the Acoustical Society of America, vol. 65, pp. 943-950, April 1979. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로