$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

빔포밍 및 DOA 기반의 마스킹을 이용한 2채널 잡음제거

Two-Channel Noise Reduction Using Beamforming and DOA-Based Masking

한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.17 no.1, 2013년, pp.32 - 40  

김영일 (경상대학교) ,  정상배 (경상대학교)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 빔포밍과 입사각분석 기반 마스킹을 이용한 다채널 음성개선 알고리즘이 제안된다. 제안된 알고리즘에서는 LCMV 빔포밍을 수행한 후에 입사각 분석을 이용한 멜-주파수 위너필터가 적용되어 잔존하는 잡음을 제거한다. 성능 향상을 위해서 빔포밍의 적응 필터 학습률과 목표 음성 스펙트럼 검출을 위한 입사각 임계치가 최적화된다. 성능 지수로서 PESQ와 출력 SNR이 측정되었으며 실험 결과 제안한 알고리즘이 종전의 최소분산 빔포밍 기법보다 PESQ 관점에서 0.09, 출력 SNR 관점에서 5.75 dB의 성능 향상시킴을 알 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose a multi-channel speech enhancement algorithm using beamforming and direction-of-arrival (DOA)-based masking. The proposed algorithm enhances noisy speech basically by the linearly constrained minimum variance (LCMV) algorithm and then a mel-scale Wiener filter designed usin...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서 제안하는 음성개선 알고리즘의 목적은 휴대용 단말기에 적용시키는 것과 목표 음성신호 구간에서 음질을 개선하는 것이다. 이를 위하여, 2-채널 마이크로폰을 사용하였고 참고문헌[10]의 LCMV 알고리즘을 기반으로 하였다.
  • 본 논문에서는 DOA 기반 마스킹을 이용한 2채널 음성개선 알고리즘을 제안하였다. 최적화된 기존의 LCMV와 DOA기반 마스킹을 하기위하여 모든 입력 SNR 기준으로 학습률과 DOA 임계치는 PESQ를 성능지수로 한 전수조사 방식을 사용하여 최적화 되었다.
  • 그림 4는 DB 수집 환경을 나타내고 있다. 본 연구에서는 휴대용 단말기를 이용한 음성통화 환경에서의 성능 측정이 목표이므로 목표 음성신호원이 잡음원보다 마이크로폰 배열에 훨씬 가까이 위치하도록 하였다. SNR에 따른 성능의 측정을 위해서 목표 음성신호와 잡음 신호가 각각 별도로 녹음되며 두 신호를 가산하여 원하는 SNR을 맞추었다.
  • 그러므로 LCMV과정에서는 음질측면에서 목표신호의 왜곡과 잡음 제거량이 고려된 최적의 학습률을 적용시켜야 한다. 이러한 최적의 학습률을 얻기 위하여 본 논문에서는 음질을 성능지수로 한 전수조사 방식을 수행하였다. 그리고 추가적인 잡음제거를 위하여 마스킹 기법을 이용하여 추정한 위너필터를 LCMV의 후처리 방법으로 사용하였다[11][12].
  • 제안된 알고리즘의 목표는 기존의 LCMV 빔포머에 마스킹을 접목시켜 효과적으로 잡음 제거를 하는 것이다. 즉, LCMV를 하여 기본적인 잡음제거가 된 결과를 입력신호의 DOA 분석 정보를 이용하여 목표 음성신호와 잡음을 분리한 후 위너필터를 통하여 추가적으로 잡음제거를 수행하는 개념이다.

가설 설정

  • 그림 1에서 K와 J는 각각 마이크로폰의 개수와 적응필터의 길이이다. LCMV 알고리즘에서는 목표 음원이 항상 마이크로폰 배열의 정면에 위치한다고 가정한다. 따라서, 정면이 아닌 다른 방향의 신호는 잡음으로 간주한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
정상성 잡음을 제거하는 방법은 무엇인가? 음성개선을 위한 잡음 제거기술은 잡음의 종류에 따라 달라진다. 일반적으로 정상성 잡음을 제거하는 방법으로는 단일채널기반의 위너필터와 칼만필터 방법이 있다[1][2]. 반면에 비정상성 잡음을 제거하기 위한 방법으로는 다채널 기반 빔포밍(beamforming)과 맹목신호분리가 있다 [3-6][7][8].
맹목신호분리의 한계는? 반면에 이동형 단말기를 위한 빔포밍 기법은 하드웨어 상의 제약조건 때문에 2-채널 이하를 사용하는 것이 불가피하 다. 맹목신호분리는 실시간 연산량의 문제와 사용하는 마이크로폰의 개수가 분리하고자 하는 음원의 개수에 의존하는 문제 때문에 실제적용에 있어서 신뢰할 만한 성능을 발휘하는데 어려움이 따른다[4][6]. 
기존의 LCMV 빔포머에 마스킹을 접목시켜 효과적으로 잡음 제거를 하는 것의 개념은? 제안된 알고리즘의 목표는 기존의 LCMV 빔포머에 마스킹을 접목시켜 효과적으로 잡음 제거를 하는 것이다. 즉, LCMV를 하여 기본적인 잡음제거가 된 결과를 입력신호의 DOA 분석 정보를 이용하여 목표 음성신호와 잡음을 분리한 후 위너필터를 통하여 추가적으로 잡음제거를 수행하는 개념이다. 이러한 동작을 위해서 본 논문에서는 채널간 위상차를 이용하여 DOA를 측정한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (14)

  1. S. Jeong andM. Hahn, "Speech quality and recognition rate improvement in car noise environments," Electronics Letters, vol. 37, no. 12, pp. 801-802, 2001. 

  2. ES 202 212 V1.1.2 "Speech processing, transmission and quality aspects(STQ); distributed speech recognition; extended advanced front-end feature extraction algorithm; compression algorithm; back-end speech reconstruction algorithm," ETSI Standard, 2005. 

  3. B. D. Van Veen and K.M. Buckley, "Beamforming: A versatile approach to spatial filtering", IEEE ASSP Magazine, vol. 5, no. 2, pp. 4-24, 1998. 

  4. M. Brandstein and D. Ward, Microphone Arrays: Signal Processing Techniques and Applications, Springer, 2001. 

  5. J. Benesty, J. Chen, and Y. Huang, Microphone Array Signal Processing (Springer Topics in Signal Processing), Springer, 2008. 

  6. A. Hyvarinen, and E. Oja, "Independent component analysis: Algorithms and applications," Neural Networks, vol. 13, no. 4, pp. 411-430, 2000. 

  7. 이영재, 김수환, 한승호, 한민수, 김영일, 정상배, "확률적 목표 음성 검출을 통한 다채널 입력 기반 음성개선," 한국음성학회학술지 말소리와 음성과학, 1권, 3호, pp. 97-104, 2009. 

  8. 박지훈,이성주,홍정표,정상배,한민수(2008). "필 터뱅크 기반 프로스트 알고리즘을 이용한 빔포밍 최적화," 대한음성학회 학술지 말소리, 66호, pp. 73-86, 2008. 

  9. L. Wang, H. Ding, and F. Yin, "Combining superdirective beamforming and frequency-domain blind source separation for highly reverberant signals," EURASIP Journal on Audio, Speech, and Music Processing, vol. 2010, pp. 1-13, 2010. 

  10. O. L. Frost, "An algorithm for linearly constrained adaptive array processing," Proceedings of the IEEE, vol. 60, no. 8, pp. 926-935, 1972. 

  11. S. Jeong, H. Yang, and M. Hahn, "Two-channel noise reduction for robust speech recognition in car environments,"Electronics Letters, vol. 44, no. 17, pp. 1042-1043, 2008. 

  12. S. Jeong, S. Lee, and M. Hahn, "Dual microphonebased speech enhancement by spectral classification and Wiener filtering," Electronics Letters, vol. 44, no. 3, pp. 253-254, 2008. 

  13. 김수환,이영재,김영일,정상배, "DOA 기반학습률 조절을 이용한 다채널 음성 개선 알고리즘,"한국음성학회 학술지 말소리와 음성과학, 3권, 3호, pp. 91-98, 2011. 

  14. http://en.wikipedia.org/wiki/PESQ 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트