최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.15 no.12, 2011년, pp.2521 - 2526
This paper proposes a speaker recognition algorithm using a perceptron neural network and LPC (Linear Predictive Coding) cepstrum coefficients. The proposed algorithm first detects the voiced sections at each frame. Then, the LPC cepstrum coefficients which have speaker characteristics are obtained ...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
본 연구에서 화자인식을 위한 전처리 과정은 어떻게 구분되는가? | 전처리 과정은 음성 신호를 표본화하여 프레임처리하는 과정, 표본화 처리된 입력 음성신호에서 유성음만을 추출하는 과정, 추출된 유성음 신호에서 선형예측 분석에 의한 선형예측부호화 cepstrum 계수를 추출하는 과정으로 구분된다. | |
선형예측분석은 어떤 가정을 이용하여 음성의 특징 추출을 위한 예측부호화가 실시되어지는가? | 선형예측분석은 일반적으로 음성신호의 표본값 사이에는 상당한 상관관계가 있다는 가정을 이용하여 음성의 특징 추출을 위한 예측부호화가 실시되어진다[7]. 이러한 가정 하에서 선형예측오차의 2승 평균값을 최소로 하도록 저역에 해당하는 LPC cepstrum 계수를 결정한다. | |
선형예측분석 과정에서는 일반적으로 음성신호의 표본값 사이에는 상당한 상관관계가 있다는 가정을 이용하여 음성의 특징 추출을 위한 예측부호화가 실시되어지는데, 이러한 가정 하에 무엇을 결정하는가? | 선형예측분석은 일반적으로 음성신호의 표본값 사이에는 상당한 상관관계가 있다는 가정을 이용하여 음성의 특징 추출을 위한 예측부호화가 실시되어진다[7]. 이러한 가정 하에서 선형예측오차의 2승 평균값을 최소로 하도록 저역에 해당하는 LPC cepstrum 계수를 결정한다. 또한 LPC cepstrum 계수는 동일한 음성이라 할지라도 화자의 개인의 감정 및 주변의 잡음환경에 따라 cepstrum의 값이 다양한 변화를 보여줄 수 있다. |
A. Revathi, Y. Venkataramani, "Speaker independent continuous speech and isolated digit recognition using VQ and HMM", 2011 International Conference on Communications and Signal Processing, pp. 198-202, 2011.
K. Kuah, M. Bodruzzaman, S. Zein-Sabatto, "A neural network-based text independent voice recognition system", Proceedings of the 1994 IEEE Southeastcon 'Creative Technology Transfer - A Global Affair'., pp. 131-135, 1994.
B. Lu, J. J. Xu, "Research on Isolated Word Speech Recognition Based on Biomimetic Pattern Recognition", 2009 International Conference on Artificial Intelligence and Computational Intelligence, Vol. 2, pp. 436-439, 2009.
D. E. Rumelhart, G. E. Hinton, and R. J. Williams, "Learning representations by back-propagation errors", Nature, Vol. 323, pp. 533-536, 1986.
S. K. Pal, S. Mitra, "Multilayer perceptron, fuzzy sets, and classification", IEEE Transaction on Neural Networks, Vol. 3, No. 5, pp. 683-697, 1992.
W. G. Knecht, M. E. Schenkel, G. S. Moschytz, "Neural network filters for speech enhancement", IEEE Trans. Speech and Audio Processing, Vol. 3, No. 6, pp. 433-438, 1995.
P. B. Patil, "Multilayered network for LPC based speech recognition", IEEE Transactions on Consumer Electronics, Vol. 44, No. 2, pp. 435-438, 1998.
H. Hirsch and D. Pearce, "The AURORA experimental framework for the performance evaluations of speech recognition systems under noisy conditions", in Proc. ISCA ITRW ASR2000 on Automatic Speech Recognition: Challenges for the Next Millennium, Paris, France, 2000.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.