최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국전자통신학회 논문지 = The Journal of the Korea Institute of Electronic Communication Sciences, v.9 no.5, 2014년, pp.543 - 548
Multiple-model based speech recognition framework (MMSR) has been known to be very successful in speech recognition. Since it uses multiple hidden Markov modes (HMMs) that corresponds to various noise types and signal-to-noise ratio (SNR) values, the selected acoustic model can have a close match wi...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
잡음에 강인한 음성인식을 위한 다양한 연구들 중 대표적인 방법은 무엇인가? | 잡음환경에서 음성인식이 이루어지는 경우 상당한 인식율의 저하가 발생한다고 알려져 있다. 다양한 연구들이 잡음에 강인한 음성인식을 위해서 진행되어 왔는데 대표적인 방법으로는 잡음에 강인한 특징추출, 음질개선 그리고 음성특징 및 모델 파라미터 보상 등을 들 수 있다 [1-7]. | |
HMM이 가장 효과적인 경우는 무엇인가? | 한편, HMM을 잡음음성으로부터 직접적으로 훈련 하는 방식은 또 다른 잡음음성인식 기법으로 자리 잡아 왔다. 이러한 접근방식은 잡음의 통계적 값이 훈련과 인식시에 큰 차이가 나지 않은 경우 가장 효과적이다. MTR 방식에서는 다양한 잡음환경의 잡음음성 신호들을 모아서 하나의 HMM set을 훈련시킨다[8]. | |
MMSR 방식에서 HMM set을 선택하기 위해 어떤 과정이 필요한가? | MMSR 방식에서는 실제 음성인식이 실행되기 전에, 인식잡음음성과 가장 일치하는 기준 HMM set을 선택하기 위해서 인식잡음음성에 포함된 잡음의 종류와 SNR 값을 추정하는 과정이 필요하다. 이 과정에서의 오류는 인식율의 저하와 바로 연결되기 때문에 MMSR 방식의 성능은 이 과정에서의 에러를 최대한줄임으로서 더욱 더 향상 될 수 있다. |
S. Ball, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. Acoust., Speech, Signal Process. vol. 27, no. 2, 1979, pp. 113-120.
M. J. F. Gales, "Model based techniques for noise-robust speech recognition," Ph.D. Dissertation, University of Cambridge, 1996.
P. J. Moreno, "Speech Recognition in noisy environments," Ph.D. Dissertation, Carnegie Mellon University, 1996.
J. Choi, "Speech and noise recognition system by neural network," J. of the Korea Institute of Electronic Communication Sciences, vol. 5, no. 4, 2010, pp. 357-362.
C. Lee and D. kim, "Adaptive noise reduction of speech using wavelet transform," J. of the Korea Institute of Electronic Communication Sciences, vol. 4, no. 3, 2009, pp. 190-196.
H. G. Hirsch and D. Pearce, "The Aurora experimental framework for the performance evaluation of speech recognition systems under noisy conditions," In Proc. the Int. Conf. on Spoken Language Processing, Bejing, China, 2000, pp. 18-20.
H. Xu, Z. H. Tan, P. Dalsgaard, and B. Lindberg, "Robust speech recognition on noise and SNR classification-a multiple-model framework," In Proc. INTERSPEECH, Lisboa, Portugal, 2005, pp. 977-980.
H. Xu, Z. H. Tan, P. Dalsgaard, and B Lindberg, "Noise condition dependent training based on noise classification and SNR estimation," IEEE Trans. Audio, Speech, Language Process., vol. 15, no. 8, 2007, pp. 2431-2443.
L. Lamel, L. Rabiner, A. Rosenberg, and J. Wilpon, "An improved endpoint detector for isolated word recognition," IEEE Trans. Acoust., Speech, Signal Process. vol. 29, no. 4, 1981, pp. 777-785.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.