최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국해양정보통신학회논문지 = The journal of the Korea Institute of Maritime Information & Communication Sciences, v.15 no.4, 2011년, pp.817 - 822
This paper first proposes the speech recognition algorithm by detection of the speech and noise sections at each frame using a neural network training by back-propagation algorithm, then proposes the spectral subtraction method which removes the noises at each frame according to detection of the spe...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
잡음 환경 하에서 음성인식의 전처리과정을 통하여 잡음을 제거하는 음질개선방식에는 어떤 것들이 있는가? | 잡음 환경 하에서 음성인식의 전처리과정을 통하여 잡음을 제거하는 음질개선방식으로는 스펙트럼 차감법(Spectral Subtraction, SS)[3], MMSE(Minimum Mean Square Error Estimation)[4] 방법들이 연구되고 있으며, 이 중에서도 대표적인 잡음대책법의 하나인 스펙트럼 차감법이 잘 알려져 있다. 스펙트럼 차감법은 잡음이 중첩된 음성의 스펙트럼으로부터 사전에 처음 몇 프레임에 해당하는 비음성구간에서 추정한 잡음 스펙트럼을 차감함으로써 잡음의 영향을 제거하는 방법이다[3]. | |
스펙트럼 차감법은 어떤 방법인가? | 잡음 환경 하에서 음성인식의 전처리과정을 통하여 잡음을 제거하는 음질개선방식으로는 스펙트럼 차감법(Spectral Subtraction, SS)[3], MMSE(Minimum Mean Square Error Estimation)[4] 방법들이 연구되고 있으며, 이 중에서도 대표적인 잡음대책법의 하나인 스펙트럼 차감법이 잘 알려져 있다. 스펙트럼 차감법은 잡음이 중첩된 음성의 스펙트럼으로부터 사전에 처음 몇 프레임에 해당하는 비음성구간에서 추정한 잡음 스펙트럼을 차감함으로써 잡음의 영향을 제거하는 방법이다[3]. 그러나 본 논문에서는 참고문헌[3]에서 제안한 방법과 다르게 신경회로망을 사용하여 각 프레임에서 음성 및 잡음 구간을 검출한다. | |
신경회로망의 오차역전파 학습알고리즘에 의한 음성 및 잡음 구간의 인식 및 신경회로망에의하여 음성 및 잡음 구간의 검출에 따라서 각 프레임에서 잡음을 제거하는 스펙트럼 차감법을 제안하고 적용한 본 연구의 결과는? | 본 논문에서는 신경회로망의 오차역전파 학습알고리즘에 의한 음성 및 잡음 구간의 인식 및 신경회로망에의하여 음성 및 잡음 구간의 검출에 따라서 각 프레임에서 잡음을 제거하는 스펙트럼 차감법을 제안하였다. SNRinput이 Clean, 10 dB, 5 dB, 0 dB로 입력된 음성 및 잡음이 중첩된 음성에 대해서 본 알고리즘이 유효하다는 것을 실험에서 확인하였다. |
Simpson, et. al., "Spectral Enhancement to Improve the Intelligibility of Speech in Noise for Hearing Impaired Listeners," Acta Otolaryngol, Suppl. 469, pp. 101-107, 1990.
J.P. Haton, "Automatic recognition of noisy speech," In A.J.R. Ayuso and J.M.L. Soler, Eds., Speech Recognition and Coding-New Advances and Trends, Springer Verlag, Berlin, Germany, pp.3-13, 1995.
S.F. Boll, "Suppression of acoustic noise in speech using spectral subtraction," IEEE Trans. Acoust., Speech, Signal Processing. Vol.27, No.2, pp. 113-120, 1979.
R. Martin, "Speech Enhancement Based on Minimum Mean-Square Error Estimation and Supergaussian Priors," IEEE Transactions on Speech and Audio Processing, Vol.13, No.5, pp. 845-856, 2005.
H. Hirsch and D. Pearce, "The AURORA experimental framework for the performance evaluations of speech recognition systems under noisy conditions," in Proc. ISCA ITRW ASR2000 on Automatic Speech Recognition: Challenges for the Next Millennium, Paris, France, 2000.
T.T. Le, J.S. Mason and T. Kitamura, "Characteristics of multi-layer perceptron models in enhancing degraded speech," Proc. ICSLP-94, pp.1611-1614, 1994.
D.E. Rumelhart, G. E. Hinton, and R. J. Williams, "Learning representations by back-propagation errors," Nature, 323, pp. 533-536, 1986.
최재승, "FFT 켑스트럼을 사용한 배경잡음의 제거," 한국해양정보통신학회 추계학술대회 논문집, 14권 2호, pp.264-267, 2010.
J. He, L. Liu, and G. Palm, "On the use of residual cepstrum in speech recognition," IEEE International Conference on Acoustics, Speech, and Signal Processing, Vol.1, pp.5-8, 1996.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.