최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.20 no.9, 2016년, pp.1673 - 1678
최재승 (Department of Electronic Engineering, Silla University)
In the area of the speech recognition processing, background noises are caused the incorrect response to the speech input, therefore the speech recognition rates are decreased by the background noises. Accordingly, a more high level noise processing techniques are required since these kinds of noise...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
음성 및 잡음을 구별하는 연구로 최근에 제안되는 것들의 한계점은 무엇인가? | 이러한 음성 및 잡음을 구별하는 수단으로서 스펙트럼의 차이를 이용하는 연구, 켑스트럼 계수의 분포를 이용하는 연구, 스펙트럼의 양자화를 이용하는 연구, 위너필터를 이용하는 연구, 신경회로망을 이용하여 판별하는 연구 들이 제안되고 있다[6-8]. 그러나 이러한 연구들은 주로 정상적인 잡음을 대상으로 하고 있으며, 또한 잡음 종류가 단순하므로 다양한 잡음 하에서 음성과 잡음을 구별하는 실험으로는 만족하지 못하고 있다. 또한 이러한 연구들은 연속한 음성에 잡음이 중첩된 경우를 대상으로 하고 있어서 음성단어 인식장치가 오동작하는 연속시간이 짧은 잡음을 대상으로 하고 있지 않다. | |
잡음이 음성인식 장치의 오작동과 음성인식률 저하의 주 원인이 되는 이유는? | 이러한 잡음에는 정상적인 배경잡음 외에 비정상적인 잡음이 일반적으로 존재한다. 이러한 비정상적인 잡음 중에는 피치 주파수 및 스펙트럼의 형태가 음성의 주파수 및 스펙트럼과 상당히 유사한 잡음들이 존재하여, 음성인식 장치의 오작동 및 음성인식률 저하의 주요 원인이 되고 있다[1-3]. | |
실제 환경에서 음성을 방해하는 배경잡음은 어떻게 표현하는 경우가 많은가? | 실제 환경에서 음성을 방해하는 배경잡음은 백색잡음과 같은 정상적인 잡음과 도로잡음과 같은 비정상적인 잡음의 합으로 표현하는 경우가 많다. 따라서 본 논문에서는 음성 중에서 정상적인 잡음과 비정상적인 잡음을 구별하기 위하여, 잡음이 섞인 음성 중에서 지속 시간이 짧은 음성을 대상으로 하여 배경잡음을 구별하는 알고리즘에 대하여 기술한다. |
C. Hanilci, T. Kinnunen, R. Saeidi, J. Pohjalainen, P. Alku, F. Ertas, J. Sandberg, and M. Hansson-Sandsten, "Comparing spectrum estimators in speaker verification under additive noise degradation," IEEE International Conference on Acoustics, Speech and Signal Processing, pp. 4769-4772, March 2012.
R. Saeidi, J. Pohjalainen, T. Kinnunen, and Paavo Alku, "Temporally Weighted Linear Prediction Features for Tackling Additive Noise in Speaker Verification," IEEE Signal Processing Letters, vol. 17, no. 6, pp. 599-602, June 2010.
R. Su, X. Liu, and L. Wang, "Automatic Complexity Control of Generalized Variable Parameter HMMs for Noise Robust Speech Recognition," IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 23, no. 1, pp. 102-114, Jan. 2015.
J. S. Choi, "Speech and Noise Recognition System by Neural Network," The Korea Institute of Electronic Communication Sciences, vol. 5, no. 4, pp. 357-362, Aug. 2010.
N. Moritz, Jorn Anemuller, and B. Kollmeier, "An Auditory Inspired Amplitude Modulation Filter Bank for Robust Feature Extraction in Automatic Speech Recognition," IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 23, no. 11, pp. 1926-1937, Nov. 2015.
S. Furui, "Speaker-Independent Isolasted Word Recognition Using Dynamic Features of Speech Spectrum," IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 34, no. 1, pp. 52-59, Feb. 1986.
J. S. Choi, "A Wiener Filter Algorithm of Noise Subtraction Based on Threshold Detection," Korean Institute of Information Technology, vol. 13, no. 7, pp. 51-56, July 2015.
X. Zhang, Y. Guo, Xuemei Hou, "A speech Recognition Method of Isolated Words Based on Modified LPC Cepstrum," IEEE International Conference on Granular Computing, pp. 481-484, Nov. 2007.
S. K. Pal, S. Mitra, "Multilayer perceptron, fuzzy sets, and classification," IEEE Transaction on Neural Networks, vol. 3, no. 5, pp. 683-697, Sep. 1992.
D. Rumelhart, G. Hinton and R. Williams, "Learning representations by back-propagation errors," Nature, vol. 323, pp. 533-536, Oct. 1986.
H. Hirsch and D. Pearce, "The AURORA experimental framework for the performance evaluations of speech recognition systems under noisy conditions," in Proc. ISCA ITRW ASR2000 on Automatic Speech Recognition: Challenges for the Next Millennium, Paris, France, Oct. 2000.
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.