최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.17 no.1, 2013년, pp.32 - 40
In this paper, we propose a multi-channel speech enhancement algorithm using beamforming and direction-of-arrival (DOA)-based masking. The proposed algorithm enhances noisy speech basically by the linearly constrained minimum variance (LCMV) algorithm and then a mel-scale Wiener filter designed usin...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
정상성 잡음을 제거하는 방법은 무엇인가? | 음성개선을 위한 잡음 제거기술은 잡음의 종류에 따라 달라진다. 일반적으로 정상성 잡음을 제거하는 방법으로는 단일채널기반의 위너필터와 칼만필터 방법이 있다[1][2]. 반면에 비정상성 잡음을 제거하기 위한 방법으로는 다채널 기반 빔포밍(beamforming)과 맹목신호분리가 있다 [3-6][7][8]. | |
맹목신호분리의 한계는? | 반면에 이동형 단말기를 위한 빔포밍 기법은 하드웨어 상의 제약조건 때문에 2-채널 이하를 사용하는 것이 불가피하 다. 맹목신호분리는 실시간 연산량의 문제와 사용하는 마이크로폰의 개수가 분리하고자 하는 음원의 개수에 의존하는 문제 때문에 실제적용에 있어서 신뢰할 만한 성능을 발휘하는데 어려움이 따른다[4][6]. | |
기존의 LCMV 빔포머에 마스킹을 접목시켜 효과적으로 잡음 제거를 하는 것의 개념은? | 제안된 알고리즘의 목표는 기존의 LCMV 빔포머에 마스킹을 접목시켜 효과적으로 잡음 제거를 하는 것이다. 즉, LCMV를 하여 기본적인 잡음제거가 된 결과를 입력신호의 DOA 분석 정보를 이용하여 목표 음성신호와 잡음을 분리한 후 위너필터를 통하여 추가적으로 잡음제거를 수행하는 개념이다. 이러한 동작을 위해서 본 논문에서는 채널간 위상차를 이용하여 DOA를 측정한다. |
S. Jeong andM. Hahn, "Speech quality and recognition rate improvement in car noise environments," Electronics Letters, vol. 37, no. 12, pp. 801-802, 2001.
ES 202 212 V1.1.2 "Speech processing, transmission and quality aspects(STQ); distributed speech recognition; extended advanced front-end feature extraction algorithm; compression algorithm; back-end speech reconstruction algorithm," ETSI Standard, 2005.
B. D. Van Veen and K.M. Buckley, "Beamforming: A versatile approach to spatial filtering", IEEE ASSP Magazine, vol. 5, no. 2, pp. 4-24, 1998.
M. Brandstein and D. Ward, Microphone Arrays: Signal Processing Techniques and Applications, Springer, 2001.
J. Benesty, J. Chen, and Y. Huang, Microphone Array Signal Processing (Springer Topics in Signal Processing), Springer, 2008.
A. Hyvarinen, and E. Oja, "Independent component analysis: Algorithms and applications," Neural Networks, vol. 13, no. 4, pp. 411-430, 2000.
이영재, 김수환, 한승호, 한민수, 김영일, 정상배, "확률적 목표 음성 검출을 통한 다채널 입력 기반 음성개선," 한국음성학회학술지 말소리와 음성과학, 1권, 3호, pp. 97-104, 2009.
박지훈,이성주,홍정표,정상배,한민수(2008). "필 터뱅크 기반 프로스트 알고리즘을 이용한 빔포밍 최적화," 대한음성학회 학술지 말소리, 66호, pp. 73-86, 2008.
L. Wang, H. Ding, and F. Yin, "Combining superdirective beamforming and frequency-domain blind source separation for highly reverberant signals," EURASIP Journal on Audio, Speech, and Music Processing, vol. 2010, pp. 1-13, 2010.
O. L. Frost, "An algorithm for linearly constrained adaptive array processing," Proceedings of the IEEE, vol. 60, no. 8, pp. 926-935, 1972.
S. Jeong, H. Yang, and M. Hahn, "Two-channel noise reduction for robust speech recognition in car environments,"Electronics Letters, vol. 44, no. 17, pp. 1042-1043, 2008.
S. Jeong, S. Lee, and M. Hahn, "Dual microphonebased speech enhancement by spectral classification and Wiener filtering," Electronics Letters, vol. 44, no. 3, pp. 253-254, 2008.
김수환,이영재,김영일,정상배, "DOA 기반학습률 조절을 이용한 다채널 음성 개선 알고리즘,"한국음성학회 학술지 말소리와 음성과학, 3권, 3호, pp. 91-98, 2011.
http://en.wikipedia.org/wiki/PESQ
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.