$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

비원어민 교수자 음성모델을 이용한 자동발음평가 시스템
An automatic pronunciation evaluation system using non-native teacher's speech model 원문보기

The journal of the institute of internet, broadcasting and communication : JIIBC, v.16 no.2, 2016년, pp.131 - 136  

박혜빈 (상명대학교 컴퓨터과학과) ,  김동헌 ((주)지앤넷) ,  정진우 (상명대학교 컴퓨터과학과)

초록

외국어 학습에서 발음학습은 가장 중요한 부분 중 하나이다. 발음학습 과정은 학습자의 발음에 대해 정확한 평가와 잘못된 발음이 있을 경우 적절한 피드백을 주어 이를 개선시키는 작업을 포함한다. 숙련된 평가자의 평가는 비용에서, 비숙련 원어민들의 평가는 일관성에서 문제가 있기 때문에 이를 보완할 수 있는 자동발음평가 시스템에 대한 연구가 진행되고 있으며 자동음성인식 기술의 활용이 각광받고 있다. 본 연구에서는 자동음성인식 기술과 비원어민 교수자의 음성 모델을 기반으로 단어 수준에서 학습자의 발음 정확성과 유창성을 평가하는 시스템을 구축하였고, 이를 통해 학습자들이 자신의 발음을 정확히 평가받고 평가결과에 따라 적절한 피드백을 받을 수 있도록 하였다. 또한 시스템의 성능평가를 통해 발음 정확성과 유창성에 대한 자동평가결과가 전반적으로 학습자의 실제 영어실력을 정확히 구분한다는 것을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

An appropriate evaluation on learner's pronunciation has been an important part of foreign language education. The learners should be evaluated and receive proper feedback for pronunciation improvement. Due to the cost and consistency problem of human evaluation, automatic pronunciation evaluation s...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구를 통해 ASR를 기반으로 하는 자동발음평가 시스템에 대한 연구와 원어민 음성으로 훈련된 ASR이 가지는 문제점을 해결하기 위한 연구에 대해 살펴보았다.
  • 본 연구에서는 단어 수준의 발음 정확성과 유창성을 평가하는 시스템을 구축하여 학습자들이 자신의 발음을 평가받고 평가결과에 따라 적절한 피드백을 받도록 하였다.
  • 본 연구에서는 비원어민 교수자의 음성모델을 구축하고, 이를 바탕으로 단어 수준의 발음 정확성과 유창성을 평가하는 시스템을 구축하였다. 먼저 음성인식의 정확성을 높이기 위해서 acoustic model adaptation을 통해 음향모델을 확장하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
ASR 시스템에서 학습자의 음성을 잘 처리하기 위해서는 어떤 것이 필요한가? 그런데 ASR 시스템은 보통 원어민 음성으로 훈련시키기 때문에 학습자의 음성을 인식한 결과는 원어민을 대상으로 인식한 결과보다 정확성과 신뢰도가 현격히 떨어진다[2]. 따라서 ASR이 학습자의 음성을 잘 처리하기 위해서는 acoustic model adaptation을 통해 인식공간을 확장해 줄 필요가 있다.
자동음성인식의 특징은? 근래 연구되는 자동발음평가 시스템은 대부분 자동음성인식 기술(Automatic Speech Recognition: ASR)을 활용하여 구축되고 있다. 자동음성인식은 은닉 마르코프모델(Hidden Markov Model: HMM)을 기반으로 하는데[16] 입력이 들어오면 모든 기준 패턴과 비교한 후 가장 유사한 패턴을 찾아 출력한다[3]. 자동음성인식의 특성상 기준 패턴을 준비하기 위한 훈련용 음성코퍼스가 필요하며, 자동발음평가 시스템에서 이것은 원어민의 발음이 된다[3].
ASR 시스템의 문제점은? 따라서 자동발음평가 시스템은 학습자의 발음이 원어민 발음과 얼마나 유사한지를 계산하고 그것을 바탕으로 평가점수를 내리게 된다. 그런데 ASR 시스템은 보통 원어민 음성으로 훈련시키기 때문에 학습자의 음성을 인식한 결과는 원어민을 대상으로 인식한 결과보다 정확성과 신뢰도가 현격히 떨어진다[2]. 따라서 ASR이 학습자의 음성을 잘 처리하기 위해서는 acoustic model adaptation을 통해 인식공간을 확장해 줄 필요가 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. Weonhee Yun. 2009. Discrepancy between Korean and Native English Raters Evaluating the English Pronunciation Spoken by Korean Learners of English. The Journal of Linguistic Science 48, 201-217. 

  2. Jonghoon Lee. 2012. Error Simulation-based Pronunciation Feedback for Korean English Learners. PhD thesis, Division of Electrical and Computer Engineering Pohang University of Science and Technology. 

  3. Weonhee Yun. 2012. The Objectives of English Pronunciation Evaluations and the Usability of Machine Scoring. The Journal of Linguistic Science 61, 167-184. 

  4. Hyunsong Chung, Tae-yeoub Jang, Weonhee Yun, Ilsung Yun, Jaejin Sa. 2008. A Study on Automatic Measurement of Pronunciation Accuracy of English Speech Produced by Korean Learners of English. Language and Linguistic 42, 165-196 

  5. Peabody, M. A. 2011. Methods for Pronunciation Assessment in Computer Aided Lanugage Learning. PhD thesis, Massachusetts Institute of Technology, Cambridge, Massachusetts, USA. 

  6. Moustroufas, N. and Digalakis, V. 2007. Automatic pronunciation evaluation of foreign speakers using unknown text. In Comput. Speech Language, 219-230. 

  7. Sherif Mahdy Abdou, Salah Eldeen Hamid, M. R. A. S. O. A.-H. M. S. and Nazih, W. 2006. Computer aided pronunciation learning system using speech recognition techniques, in Interspeech. 

  8. Chitralekha Bhat, K.L. Srinivas, P. R. 2010. Pronunciation scoring for indian english learners using a phone recognition system. In Proceedings of the First International Conference on Intelligent Interactive Technologies and Multimedia, 135-139. 

  9. Srikanth, R. and Salsman, L. B. J. 2012. Automatic Pronunciation Evaluation And Mispronunciation Detection Using CMUSphinx. In 24th International Conference on Computational Linguistics 61-68. 

  10. Needleman, Saul B., and Christian D. Wunsch. 1970. A general method applicable to the search for similarities in the amino acid sequence of two proteins. Journal of molecular biology 48.3, 443-453. 

  11. W. Walker, P. Lamere, P. Kwok, B. Raj, R. Singh, E. Gouvea, P. Wolf, and J. Woelfel. 2004. Sphinx-4: A flexible open source framework for speech recognition. Sun Microsystems Inc. Technical Report SML1 TR2004-0811. 

  12. Hauswald, Johann, et al.. 2015. Sirius: An open end-to-end voice and vision personal assistant and its implications for future warehouse scale computers. Proceedings of the Twentieth International Conference on Architectural Support for Programming Languages and Operating Systems. ACM. 

  13. Harrison, A. M., Lau, W. Y., Meng, H. M., and Wang, L. 2009. Improving mispronunciation detection and diagnosis of learners' speech with context-sensitive phonological rules based on language transfer. In INTERSPEECH 2787-2790. 

  14. Witt, S. M., and Young, S. J. 1997. Language learning based on non-native speech recognition. In Eurospeech. 

  15. Kim, S. D., Kim, W. S., & Woo, I. S. 2011. A Study on the Multilingual Speech Recognition using International Phonetic Language. Journal of the Korea Academia-Industrial cooperation Society, 12(7), 3267-3274. 

  16. Jong-Young Ahn, Sang-Bum Kim, Su-Hoon Kim, Kang-In Hur, 2011. A study on Voice Recognition using Model Adaptation HMM for Mobile Environment Journal of Institute of Internet, Broadcasting and Communication (IIBC). 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로