최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기The journal of the institute of internet, broadcasting and communication : JIIBC, v.17 no.1, 2017년, pp.199 - 206
Environmental noise can degrade the performance of speech recognition system. This paper presents a procedure for performing cepstrum based feature compensation to make recognition system robust to noise. The approach is based on direct compensation of spectral tilt to remove effects of additive noi...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
잡음 음성인식이란? | 잡음 음성인식은 잡음으로 인해 저하된 음성인식 시스템의 성능을 향상시키는 기술로서, 다양한 방법으로 잡음의 영향을 최소화하는 연구가 발표되고 있다[1-4]. 잡음이 섞인 음성에서 잡음을 필터링하거나 깨끗한 음성의 파라미터를 추정하는 방법에는 Wiener 필터링[5], Kalman 필터링[6], 스펙트럼 차감(spectral subtraction)[7] 및 켑스트럼 평균 차감(CMS: cepstral mean subtraction)[8] 등의 방법이 있다. | |
음성인식 시스템의 성능을 떨어뜨리는 음향학적 왜곡의 중요한 원인은? | 음성인식 시스템의 성능을 떨어뜨리는 음향학적 왜곡(acoustical distortion)은 여러 가지가 있다. 그 중 가장 중요한 원인은 부가적인 잡음이다. 음성인식 시스템의 훈련과정이나 인식과정에서 잡음환경이 서로 같으면 음성 인식기는 가장 좋은 인식 성능을 가진다. | |
스펙트럼 차감은 어디에 이용되는가? | 잡음이 섞인 음성에서 잡음을 필터링하거나 깨끗한 음성의 파라미터를 추정하는 방법에는 Wiener 필터링[5], Kalman 필터링[6], 스펙트럼 차감(spectral subtraction)[7] 및 켑스트럼 평균 차감(CMS: cepstral mean subtraction)[8] 등의 방법이 있다. 특히 스펙트럼 차감은 배경 잡음의 차감에 효과적이며 음성인식, 음성 향상(speech enhancement) 및 화자 확인(speaker verification)에 널리 이용된다. |
P. J. Moreno, Speech Recognition in Noisy Environments, Ph. D, Dissertation, Carnegie Mellon University, 1996.
H. Hermansky, "RASTA processing of speech," IEEE Trans. Speech Audio processing, vol. 2, pp. 578-589, Oct. 1994. DOI: https://doi.org/10.1109/89.326616
M. J. Gales, S. Young, "Robust speech recognition using parallel model combination," IEEE Trans. Speech Audio processing, vol. 4. pp. 352-359, Sep. 1996.
J. Y. Ahn, Y. S. Kim, S. H. Kim, K. I. Hur, "A Study on Voice Recognition Pattern matching level for vehicle ECU control," The Journal of The Institute of Internet, Broadcasting and Communication (JIIBC), Vol. 10, No. 1, pp.75-80, Feb. 2010.
S. V. Vaseghi and B. P. Milner, "Noise compensation methods for hidden Markov model speech recognition in adverse environments," IEEE Trans. Speech and Audio Processing, vol. 5, No. 1, pp. 11-21, Jan. 1997.
D. C. Popescu and I. Zeljkovic, "Kalman filtering of colored noise for speech enhancement," ICSLP'96, Philadelphia, vol. 1, pp.426-429, Oct. 1996.
S. F. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. Acoust., Speech, Signal Processing, vol. ASSP-27, no. 2, pp. 113-120, Apr. 1979.
D. Naik, "Pole-filtered cepstral mean subtraction," ICSLP'95, Detroit, vol. 1, pp. 157-160, May, 1995.
L. R. Rabiner and R. W. Schafer, Digital Processing of Speech Signals, Prentice-Hall, 1978.
J. Deller, Jr, J. Proakis and J. Hansen, Discrete-Time Processing of Speech Signals, Macmillan Publishing Co, New York, 1993.
V. Goncharoff, E. VonColln, and R. Morris, "Efficient calculation of spectral tilt from various LPC parameters," Proc. IASTED, pp. 60-63, Nov. 1995.
A. Oppenheim and D. Johnson, "Discrete representation of signals," Proc. of IEEE, vol. 60, no. 6, pp. 681-691, June, 1972.
P. A. Regalia, S. K. Mitra and P. P. Vaidyanathan, "The digital all-pass filter: A versatile signal processing building block," Proc. of IEEE, vol. 76, no. 1, pp. 19-37, Jan. 1988.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.