최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보와 통신 : 한국통신학회지 = Information & communications magazine, v.33 no.9, 2016년, pp.17 - 23
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
모델 기반 특징 향상 방법의 단점은 무엇인가? | 또, 인식을 위한 최종 특징 입력에 가까운 단계에서 데이터를 처리하므로 인식에 밀접한 영향을 준다는 장점이 있다. 그러나 대략적인 왜곡 요인 관련 파라미터 추정 때문에 음성인식 성능이 하락되는 단점이 있다. 최근에 기존 모델 기반 특징 향상의 단점을 개선하여 가산 잡음이나 반향 환경에 적합한 방법이 제안되었다. | |
BSSA 방법에서 성능이 저하되는 문제가 발생하는 이유는 무엇 때문인가? | 따라서, 이 방법을 이용해 적은 수의 분리 필터 탭과 마이크 로폰의 수로 잡음 추정을 하여 음성을 향상시킬 수 있다. 그러 나, BSSA 방법은 여전히 비결정 상황에서 관찰 신호 중 사용자 음성 성분과 잡음 성분의 크기를 정확히 추정할 수 없기 때문에 성능이 저하되는 문제점이 있다. | |
BSSA 방법에서는 어떻게 잡음을 추정하는가? | 앞서 설명한 바와 같이 기존 특징 향상 방법에서 가산 잡음 파라미터를 정확히 추정하는 것은 어려운 일이다. 한편, BSSA 방법[4]은 독립성분분석으로 사용자의 음성신호를 제거한 다수의 출력을 만든 뒤, 이 출력에 역투사(projection back; PB)를 적용해 지연합(delay and sum; DS) 신호에 함유된 잡음을 추정한다. 특히, 이 방법은 지연합에 의해 향상된 신호와 추정된 잡음을 단순 차감하여 비결정 상황에서도 효율적으로 음성을 향상시킬 수 있다. |
T. Virtanen et al. Techniques for Noise Robustness in Automatic Speech Recognition (John Wiley & Sons, 2012)
J. Huang et al. Improved modulation spectrum enhancement methods for robust speech recognition. Signal Process 92, 2791-2814 (2012)
I. Mporas et al. Context-adaptive pre-processing scheme for robust speech recognition in fast-varying noise environment. Signal Process 91, 2101-2111 (2011)
Y. Takahashi, et al. Blind spatial subtraction array for speech enhancement in noisy environment. IEEE Transactions on Audio Speech, Language Processing 17, 650-664 (2009)
F. Nesta & M. Matassoni. Robust automatic speech recognition through on-line semi blind source extraction. in Proc. 1st Int. Workshop on Machine Listening in Multisource Environments (CHiME), 18-23 (2011)
M. Wu & DeLiang Wang, A two-stage algorithm for one-microphone reverberant speech enhancement. Audio, Speech, and Language Processing, IEEE Transactions on 14, 774-784 (2006)
K. Lebart et al. A new method based on spectral subtraction for speech dereverberation. Acta Acustica United with Acustica 87, 359-366 (2001)
EA. Krueger & R. Haeb-Umbach. Model-based feature enhancement for reverberant speech recognition. IEEE Transcations on Audio, Speech and Language Processing 18, 1692-1707 (2010)
A. Krueger, et al. Bayesian feature enhancement for ASR of noisy reverberant real-world data. in Proc. Interspeech, Portland, USA (2012)
C. Han et al. Reverberation and Noise Robust Feature Compensation Based on IMM. Audio, Speech, and Language Processing, IEEE Transactions on 21, 1598-1611 (2013)
H. Bass, H. Bauer & L. Evans, Atmospheric absorption of sound: Analytical expressions. J. Acoust. Soc. Am. 52, 821-825, (1972)
Ji-Won Cho & Hyung-Min Park. Independent Vector Analysis Followed by HMM-Based Feature Enhancement for Robust Speech recognition. Signal Processing 120, 200-208 (2015)
Ji-Won Cho & Hyung-Min Park. An efficient HMMbased feature enhancement method with filter estimation for reverberant speech recognition. IEEE Signal Processing Letters 20, 1199-1202 (2013)
H. Hirsch & D. Pearce. The aurora experimental framework for the performance evaluation of speech recognition systems under noisy conditions. in ASR2000-Automatic Speech Recognition: Challenges for the New Millenium ISCA Tutorial and Research Workshop (ITRW), (2000)
S. Young et al. The HTK Book (Entropic Cambridge Research Laboratory Cambridge, 1997)
S. Nakaumra K. HIyane, F. Asano, T. Nishiura and T. Yama da, Acoustical sound database in real environments for sound scene understanding and hands-free speech recognition, in LREC (2000)
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.