$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

대학생들이 또렷한 음성과 대화체로 발화한 영어문단의 구글음성인식
Google speech recognition of an English paragraph produced by college students in clear or casual speech styles 원문보기

말소리와 음성과학 = Phonetics and speech sciences, v.9 no.4, 2017년, pp.43 - 50  

양병곤 (부산대학교)

Abstract AI-Helper 아이콘AI-Helper

These days voice models of speech recognition software are sophisticated enough to process the natural speech of people without any previous training. However, not much research has reported on the use of speech recognition tools in the field of pronunciation education. This paper examined Google sp...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이 논문에서는 음성인식 기술을 발음진단과 개선에 활용할 목적으로 33명의 대학생들이 또렷한 음성과 대화체의 두 가지 양식으로 발음한 영어문단을 구글음성인식기를 이용해 인식시키고, 원문텍스트와 인식된 어구의 단어를 비교했다. R의 분석스크립트와 table 함수를 이용해서 단어별로 바르게 인식된 빈도수와 오인식된 단어들을 조사했다.
  • 이 연구의 목적은 영어전공 대학생들이 서로 다른 발화 양식으로 영어문단을 읽었을 때 음성인식기가 어떤 표현이나 단어를 잘 인식하고, 잘 인식되지 않는 표현이나 단어의 음성언어학적 특징은 무엇인지 등을 살펴봄으로써 이들의 영어발음을 진단하고 교정하는데 근본적인 도움을 주는 것이다. 연구문제를 구체적으로 서술하면 다음과 같다.
  • 이러한 참여자별 특성을 살펴보기 위해 에 개인별로 또렷한 음성과 대화체의 발화양식에 따라 인식률의 변화를 나타내어 보았다.
  • 이번에는 구체적으로 어떤 단어들이 이런 발화양식에 따른 단어인식률의 차이를 보였는지를 를 통해 살펴보기로 한다.
  • 이번에는 어구별로 또렷한 음성과 대화체에 대한 단어인식률을 를 통해 살펴본다.

가설 설정

  • 3. 또렷한 음성의 단어인식률 평균값으로 구분한 상・하위집단별 단어인식 유형은 어떠한가?
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
화자는 환경에 따라 발화방식을 어떻게 달리 하는가? 일상생활에서 화자는 환경에 따라 발화방식을 달리하는데 Lindblom(1990)은 아주 시끄러운 환경에서는 좀 더 크고 또렷하게 천천히 발화하고(Hyper-dimension), 조용한 환경에서는 약간 낮은 목소리로 빠르게 발화하는(Hypo-dimension) 방식으로 청자를 의식해서 자신의 목소리를 조절한다고 했다. 실제 이런 구분은 이분법으로 나눠지기 보다는 양극단 사이에 여러 가지 연속된 단계의 한 부분에 해당한다.
바이보이스란? 오늘날 음성인식 기술은 다양한 국적을 가진 모국어 화자의 발음을 빠르고 정확하게 인식할 정도로 발전했다. 예전에는 바이보이스와 같이 일정 시간에 걸쳐 화자 개인의 목소리를 입력하여 발화 특징을 추출한 다음 그 화자에서만 작동하는 음성인식이 사용되었고, 단어인식률도 기존의 학습된 표현이나 어휘에 대해서는 높지만, 새로운 입력에 대해서는 오류가 나는 경우가 많았다. 최근의 구글음성인식기를 비롯한 새로운 소프트웨어의 성능은 많은 연구자들이 말로서 문서를 작성하고 편집할 수 있을 정도로 개선되었다.
영어에서 볼 수 있는 음소배열론은? 음소배열론은 Crystal(1992)에 따르면 어떤 한 언어에 나타나는 음소들의 배열유형을 나타낸다. 예를 들어, 영어에서는 초성자음군이 주로 spr, str, skr 등으로 규칙적으로 나타나며 smr과 같은 경우는 나오지 않는다. 이런 음절이 실제 나타나는 단어에서의 분포도 다르기 때문에 많이 나타날수록 어휘근접밀도도 높아지게 되고 인식기의 성능도 떨어질 수 있다. 그래서 윤정희(2013)는 학습하기 어려운 음운요소가 들어가 있는 단어들이 오히려 인식률이 높게 나타난 현상에 대해, 길이가 짧은 단어는 어휘근접밀도가 높고 단어수가 많은데 비해 길이가 긴 단어들은 잘못 인식이 될 만한 단어가 적어서 일부 음소를 부정확하게 발음하더라도 더 정확히 인식한 것으로 추정했다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. Boersma, P., & Weenink, D. (2017). Praat: Doing phonetics by computer. Retrieved from http://www.fon.hum.uva.nl/praat/ on October 2, 2017. 

  2. Crystal, D. (1992). An encyclopedic dictionary of language and languages. Middlesex, U.K.: Blackwell. 

  3. Fowler, C., & Housum, J. (1987). Talkers' signalling of "new" and "old" words in speech and listeners' perception and use of the distinction. Journal of Memory and Language, 26, 489-504. 

  4. Fromkin, V., & Rodman, R. (2013). An introduction to language. Belmont, CA: Wadsworth. 

  5. Jusczyk, P., Luce, P., & Charles-Luce, J. (1994). Infants' sensitivity to phonotactic patterns in the native language. Journal of Memory & Language, 33, 630-645. 

  6. Kent, R., & Read, C. (2002). Acoustic analysis of speech. San Diego, CA: Singular Publishing Group. 

  7. Lindblom, B. (1990). Explaining phonetic variation: A sketch of the H-H theory. In W. Hardcastle, & A. Marchal (Eds.), Speech production and speech modelling (pp. 403-439). London: Kluwer Academic Press. 

  8. Luce, P., & Pisoni, D. (1998). Recognizing spoken words: The neighborhood activation model. Ear & Hearing, 19, 1-36. 

  9. Pickett, J. (1987). The sounds of speech communication: A primer of acoustic phonetics and speech perception. Austin, Texas: pro-ed. 

  10. R. Core Team. (2017). R: A language and environment for statistical computing. Retrieved from https://www.r-project.org/ [R Foundation for Statistical Computing, Vienna, Austria] on October 1, 2017. 

  11. Vitevitch, M., & Luce, P. (2004). A web-based interface to calculate phonotactic probability for words and nonwords in English. Behavior Research Methods, Instruments, & Computers, 36(3), 481-487. 

  12. Wright, R. (2003). Factors of lexical competition in vowel articulation. In J. Local, R. Ogden, & R. Temple (Eds.), Papers in laboratory phonology VI (pp. 75-87). Cambridge: Cambridge University Press. 

  13. Yang, B. (2012). Pitch and formant trajectories of English vowels by American males with different speaking styles. Phonetics and Speech Sciences, 4(1), 21-28. (양병곤 (2012). 발화방식에 따른 미국인 남성 영어모음의 피치와 포먼트 궤적. 말소리와 음성과학, 4(1), 21-28.) 

  14. Yang, B. (2014). Spectral characteristics and formant bandwidths of English vowels by American males with different speaking styles. Phonetics and Speech Sciences, 6(4), 91-99. (양병곤 (2014). 발화방식에 따른 미국인 남성 영어모음의 스펙트럼 특성과 포먼트 대역. 말소리와 음성과학, 6(4), 91-99.) 

  15. Yun, J. (2014). Analysis of Google Voice Actions' recognition ofEnglish word pronunciations by Korean young learners ofEnglish for the purpose of developing an English teachingassistant robot. M.A. Thesis, Kyungpook National University.(윤정희 (2014). Google 음성인식프로그램에 의한 한국 어린이 영어학습자의 영어단어 발음인식 실태분석: 영어학습도우미 로봇개발을 목적으로. 경북대학교 석사학위논문.) 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로