최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.23 no.1, 2019년, pp.33 - 38
윤기무 (Department of Computer Science and Engineering, Incheon National University) , 김우일 (Department of Computer Science and Engineering, Incheon National University)
This paper proposes an effective recognition method of VPI patient's speech employing DNN-HMM-based speech recognition system, and evaluates the recognition performance compared to GMM-HMM-based system. The proposed method employs speaker adaptation technique to improve VPI speech recognition. This ...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
VPI 환자 음성 샘플 수집을 위하여 사용한 데이터베이스는? | VPI 환자 음성 샘플 수집을 위한 발음 목록으로 한국어 음성 인식 분야에서 많은 연구자들이 사용하고 있는 PBW452 데이터베이스[3]의 단어 목록을 사용하였다. 언어치료사가 PBW452 단어 목록의 452개 단어 중에서 VPI 환자의 발음 오류가 자주 발생하는 50개의 단어를 선정하여 이를 발음 목록으로 사용하였다. | |
구개인두부전증이란 어떤 증상인가? | 구순구개열은 선천적으로 입술 (구순) 또는 입천장 (구개)가 갈라져서 구강과 비강이 연결된 상태를 말하며, 안면의 선천성 기형 중 빈도가 높은 장애의 하나로 알려져 있다[1][2]. 정상인이 음성을 발음할 때는 연구 개가 비강과 구강을 차단함으로써 비음을 제한하지만, 구순구개열 환자의 경우에는 경구개 또는 연구개가 벌어져 있거나 선천적으로 연구개가 짧기 때문에, 발성 시에 성대로부터 나온 기류가 비강과 구강을 동시에 공명 하게 되어 발성 및 조음 장애를 일으키게 된다. 이러한 증상을 구개인두부전증 (Velopharyngeal Insufficiency, VPI)이라고 한다. | |
구순구개열이란 무엇인가? | 구순구개열은 선천적으로 입술 (구순) 또는 입천장 (구개)가 갈라져서 구강과 비강이 연결된 상태를 말하며, 안면의 선천성 기형 중 빈도가 높은 장애의 하나로 알려져 있다[1][2]. 정상인이 음성을 발음할 때는 연구 개가 비강과 구강을 차단함으로써 비음을 제한하지만, 구순구개열 환자의 경우에는 경구개 또는 연구개가 벌어져 있거나 선천적으로 연구개가 짧기 때문에, 발성 시에 성대로부터 나온 기류가 비강과 구강을 동시에 공명 하게 되어 발성 및 조음 장애를 일으키게 된다. |
S. G. Fletcher, "Theory and instrumentation for quantitative measurement of nasality," Cleft Palate Journal, vol. 7, pp. 601-609, 1970.
J. Lee, W. Kim, K. Kim, M. Sung and T. Kwon, "Research on Construction of the Korean Speech Corpus in Patient with Velopharyngeal Insufficiency," Korean Journal of Otorhinolaryngol - Head & Neck Surgery, vol. 55, no. 8, pp. 498-507, 2012 .
S. Young, HTK Book, Ver. 3.4, Cambridge, UK: Cambridge University Press, 2006.
ETSI standard document, ETSI ES 201 108 v1.1.2 (2000-04), Feb. 2000.
J. L. Gauvain and C. H. Lee, "Maximum a Posteriori Estimation for Multivariate Gaussian Mixture Observations of Markov Chains," IEEE Trans. on Speech and Audio Proc., vol. 2, no. 2, pp. 291-298, 1994.
C. J. Leggetter and P. C. Woodland, "Maximum Likelihood Linear Regression for Speaker Adaptation of Continuous Density HMMs," Computer Speech and Language, 9, pp. 171-185, 1995.
J.-T. Huang, J. Li, D. Yu, L. Deng and Y. Gong, "Crosslanguage knowledge transfer using multilingual deep neural network with shared hidden layers," IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP-2013), pp. 7304-7308, 2013.
W. Hu, Y. Qian and F. K. Soong, "A DNN-based acoustic modeling of tonal language and its application to Mandarin pronunciation training," IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP-2014), pp. 3206-3210, 2014.
S. Liu, and K. C. Sim, "On combining DNN and GMM with unsupervised speaker adaptation for robust automatic speech recognition," IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP-2014), pp. 195-199, 2014.
D. Yu, L. Deng, Automatic Speech Recognition; A Deep Learning Approach, Springer, 2015.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.