철자 기반과 음절 기반 속도가 한국인 영어 학습자의 발음 평가에 미치는 영향 비교 Comparing the effects of letter-based and syllable-based speaking rates on the pronunciation assessment of Korean speakers of English원문보기
본 연구에서는 AI Hub에 구축된 '교육용 한국인의 영어 음성 데이터'에 있는 발음 평가 데이터를 활용하여 철자 기반 발화 속도 및 조음 속도와 음절 기반 발화 속도 및 조음 속도 중 발음 정확성 및 운율 유창성, 합산 점수를 예측하는 모델에 어떤 요소가 더 유의미한 영향을 미치는지 분석하였다. 이를 위해 13세, 19세, 26세 연령별, 성별, 수준별로 이 코퍼스의 훈련 데이터에서 총 900개 발화를 추출하여 데이터에 포함된 다양한 요소를 활용해 평가 점수를 예측하는 선형효과분석을 실행하였다. 선형효과분석에서 최적의 세 개 모델을 통해 예측된 평가 점수를 검증 데이터에서 추출한 총 180개 발화의 평가 점수와 얼마나 상관관계가 있는지도 분석하였다. 분석 결과 발음의 정확성과 운율의 유창성, 합산 점수 예측 모델 모두 철자 기반 발화 속도와 조음 속도보다 음절 기반 발화 속도와 조음 속도가 평가 점수를 예측하는데 더 큰 영향을 주는 것으로 밝혀졌다. 모델에서 예측한 점수와 검정 데이터의 실제 점수와의 상관계수는 .65에서 .68 사이로 각 모델의 평가 점수 예측력이 나쁘지 않았다. 발화 속도와 조음 속도 간에 어떤 요소가 더 큰 영향을 미치는지는 본 연구를 통해 밝혀내지 못하였다.
본 연구에서는 AI Hub에 구축된 '교육용 한국인의 영어 음성 데이터'에 있는 발음 평가 데이터를 활용하여 철자 기반 발화 속도 및 조음 속도와 음절 기반 발화 속도 및 조음 속도 중 발음 정확성 및 운율 유창성, 합산 점수를 예측하는 모델에 어떤 요소가 더 유의미한 영향을 미치는지 분석하였다. 이를 위해 13세, 19세, 26세 연령별, 성별, 수준별로 이 코퍼스의 훈련 데이터에서 총 900개 발화를 추출하여 데이터에 포함된 다양한 요소를 활용해 평가 점수를 예측하는 선형효과분석을 실행하였다. 선형효과분석에서 최적의 세 개 모델을 통해 예측된 평가 점수를 검증 데이터에서 추출한 총 180개 발화의 평가 점수와 얼마나 상관관계가 있는지도 분석하였다. 분석 결과 발음의 정확성과 운율의 유창성, 합산 점수 예측 모델 모두 철자 기반 발화 속도와 조음 속도보다 음절 기반 발화 속도와 조음 속도가 평가 점수를 예측하는데 더 큰 영향을 주는 것으로 밝혀졌다. 모델에서 예측한 점수와 검정 데이터의 실제 점수와의 상관계수는 .65에서 .68 사이로 각 모델의 평가 점수 예측력이 나쁘지 않았다. 발화 속도와 조음 속도 간에 어떤 요소가 더 큰 영향을 미치는지는 본 연구를 통해 밝혀내지 못하였다.
This study investigated the relative effectiveness of letter-based versus syllable-based measures of speech rate and articulation rate in predicting the articulation score, prosody fluency, and rating sum using "English speech data of Koreans for education" from AI Hub. We extracted and analyzed 900...
This study investigated the relative effectiveness of letter-based versus syllable-based measures of speech rate and articulation rate in predicting the articulation score, prosody fluency, and rating sum using "English speech data of Koreans for education" from AI Hub. We extracted and analyzed 900 utterances from the training data, including three balanced age groups (13, 19, and 26 years old). The study built three models that best predicted the pronunciation assessment scores using linear mixed-effects regression and compared the predicted scores with the actual scores from the validation data (n=180). The correlation coefficients between them were also calculated. The findings revealed that syllable-based measures of speech and articulation rates were more effective than letter-based measures in all three pronunciation assessment categories. The correlation coefficients between the predicted and actual scores ranged from .65 to .68, indicating the models' good predictive power. However, it remains inconclusive whether speech rate or articulation rate is more effective.
This study investigated the relative effectiveness of letter-based versus syllable-based measures of speech rate and articulation rate in predicting the articulation score, prosody fluency, and rating sum using "English speech data of Koreans for education" from AI Hub. We extracted and analyzed 900 utterances from the training data, including three balanced age groups (13, 19, and 26 years old). The study built three models that best predicted the pronunciation assessment scores using linear mixed-effects regression and compared the predicted scores with the actual scores from the validation data (n=180). The correlation coefficients between them were also calculated. The findings revealed that syllable-based measures of speech and articulation rates were more effective than letter-based measures in all three pronunciation assessment categories. The correlation coefficients between the predicted and actual scores ranged from .65 to .68, indicating the models' good predictive power. However, it remains inconclusive whether speech rate or articulation rate is more effective.
Bates, D., Machler, M., Bolker, B., & Walker, S. (2015). Fitting linear?mixed-effects models using lme4. Journal of Statistical Software,?67(1), 1-48.
Chakrabarti, A., & Ghosh, J. K. (2011). AIC, BIC and recent advances?in model selection. In P. S. Bandyopadhyay, & M. R. Forster?(Eds.), Philosophy of statistics: Handbook of the philosophy of?science (pp. 583-605). North Holland: Elsevier.
Chen, L., Zechner, K., Yoon, S. Y., Evanini, K., Wang, X., Louskina,?A., Tao, J., ... Gyawali, B. (2018). Automated scoring of nonnative?speech using the SpeechRaterSM v. 5.0 engine. ETS Research?Report Series, 2018(1), 1-31.
Choi, N., & Jang, T. Y. (2023). Evaluation of English speaking?proficiency under fixed speech rate: Focusing on utterances?produced by Korean child learners of English. Phonetics and?Speech Sciences, 15(1), 47-54.
Chung, H. (2022). Relationships between rhythm and fluency indices?and listeners' ratings of Korean speakers' English paragraph?reading. Phonetics and Speech Sciences, 14(4), 25-33.
De Jong, N., & Wempe, T. (2008). Praat script syllable nuclei.?[Computer script]. Retrieved from https://github.com/FieldDB/Praat-Scripts/blob/main/praat-script-syllable-nuclei-v2file.praat/
Han, S. H. (2023, June). Design and construction of Korean speech AI?datasets for multilingual translation and language education.?Proceedings of the 2023 Spring Conference of the Korean Society?of Speech Sciences (pp. 16-27). Seoul, Korea.
Ishikawa, S. (2014). Design of the ICNALE spoken: A new database?for multi-modal contrastive interlanguage analysis. In S. Ishikawa?(Ed.), Learner corpus studies in Asia and the world (pp. 63-76).?Kobe, Japan: Kobe University.
Ishikawa, S. (2019). The ICNALE spoken dialogue: A new dataset for?the study of Asian learners' performance in L2 English interviews.?English Teaching, 74(4), 153-177.
Kang, O. (2010). Relative salience of suprasegmental features on judgments of L2 comprehensibility and accentedness. System?38(2), 301-315.
Kim, M. S., & Jang, T. Y. (2019). Pauses and speech rates in assessing?fluency of English speech. The Korean Journal of Linguistics,?44(3), 315-339.
Kuznetsova, A., Brockhoff, P. B., & Christensen, R. H. B. (2017).?lmerTest Package: Tests in linear mixed effects models. Journal of?Statistical Software, 82(13), 1-26.
Nation, I., & Beglar, D. (2007). A vocabulary size test. The Language?Teacher, 31(7), 9-13.
National Information Society Agency. (2023). English speech data of?Koreans for education. Retrieved from https://aihub.or.kr/
R Core Team. (2023). R: A language and environment for statistical?computing (version 4.3.0) [Computer software]. Vienna, Austria:?R Foundation for Statistical Computing. Retrieved from https://www.R-project.org/
Rhee, S. C., Lee, S. H., Kang, S. K., & Lee, Y. J. (2003). Design and?construction of Korean-spoken English corpus (K-SEC). Malsori,?46, 159-174.
Thomson, R. I. (2015). Fluency. In M. Reed, & J. M. Levis (Eds.), The?handbook of English pronunciation (pp. 209-226). Chichester,?UK: John Wiley & Sons, Inc.
White, L., & Mattys, S. L. (2007). Calibrating rhythm: First language?and second language studies. Journal of Phonetics, 35(4), 501-522.
Yang, I. Y. (2021). Differential contribution of English suprasegmentals to L2 foreign-accentedness and speech comprehensibility:?Implications for teaching EFL pronunciation, speaking, and?listening. Korean Journal of English Language and Linguistics,?21, 818-836.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.