Formant frequencies depend on the position of tongue, the shape of lips, and larynx. In the auditory system, the external ear canal is an open-end resonator, which can modify the voice characteristics. This study investigates the effect of the real ear on formant frequencies. Fifteen subjects rangin...
Formant frequencies depend on the position of tongue, the shape of lips, and larynx. In the auditory system, the external ear canal is an open-end resonator, which can modify the voice characteristics. This study investigates the effect of the real ear on formant frequencies. Fifteen subjects ranging from 22 to 30 years of age participated in the study. This study employed three corner vowels: the low central vowel /a/, the high front vowel /i/, and the high back vowel /u/. For this study, the voice of a well-educated undergraduate who majored in speech-language pathology, was recorded with a high performance condenser microphone placed in the upper pinna and in the ear canal. Paired t-test showed that there were significant difference in the formant frequencies of F1, F2, F3, and F4 between the free field and the real ear. For /a/, all formant frequencies decreased significantly in the real ear. For /i/, F2 increased and F3 and F4 decreased. For /u/, F1 and F2 increased, but F3 and F4 decreased. It seems that these voice modifications in the real ear contribute to interpreting voice quality and understanding speech, timbre, and individual characteristics, which are influenced by the shape of the outer ear and external ear canal in such a way that formant frequencies become centralized in the vowel space.
Formant frequencies depend on the position of tongue, the shape of lips, and larynx. In the auditory system, the external ear canal is an open-end resonator, which can modify the voice characteristics. This study investigates the effect of the real ear on formant frequencies. Fifteen subjects ranging from 22 to 30 years of age participated in the study. This study employed three corner vowels: the low central vowel /a/, the high front vowel /i/, and the high back vowel /u/. For this study, the voice of a well-educated undergraduate who majored in speech-language pathology, was recorded with a high performance condenser microphone placed in the upper pinna and in the ear canal. Paired t-test showed that there were significant difference in the formant frequencies of F1, F2, F3, and F4 between the free field and the real ear. For /a/, all formant frequencies decreased significantly in the real ear. For /i/, F2 increased and F3 and F4 decreased. For /u/, F1 and F2 increased, but F3 and F4 decreased. It seems that these voice modifications in the real ear contribute to interpreting voice quality and understanding speech, timbre, and individual characteristics, which are influenced by the shape of the outer ear and external ear canal in such a way that formant frequencies become centralized in the vowel space.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이 연구는 여성이 발화한 모음 /ㅏ/, /ㅣ/, /ㅜ/를 외이도에서 녹음하여 실이 공명이 모음의 포먼트 주파수 F1, F2, F3, F4에 미치는 영향을 확인하는데 목적이 있으며, 이를 통해 외이 공명이 음성에 미치는 정보를 획득하고자 한다.
제안 방법
두 개의 마이크로 동시에 받은 실험 음성은 2 채널 증폭기(Scarlett 6i6, Focusrite, USA)로 증폭하고, Audition CS6 (Adobe, USA)에서 44,100 Hz 비율로 녹음하여 개인용 컴퓨터(DBP 400-PC313S, 삼성전자, 한국)에 저장하였다.
따라서 100 부터 6,000 Hz까지 100 Hz 단위의 순음을 두 개의 마이크로 동시에 녹음한 후, MatLab (R2014a, MathWorks, USA)을 이용하여 보정하였다.
청자의 외이 및 중이 상태는 맹관인 외이도 공명 특성에 영향을 줄 수 있어서 중요하다. 따라서 이에 대한 객관적 검사가 필요하며, 이를 위하여 이미턴스(middle ear analyzer, GSI 33, Grason-Stadler, Inc., USA) 검사기로 고막운동도(tympanogram)를 검사하였다. 모든 연구 참여자들의 고막운동도는 검사 상 외이도 용적(1.
발성은 입술로부터 20 cm 이내에 둔 마이크(SM48, Shure, USA)로 받아 CSL, MDVP의 음량지시계(volume unit meter)로 관찰하면서 5 초 동안 지속하여 충분히 연습하였다. 연습을 마친 후, 음성을 같은 방법으로 표본 비율 44,100 Hz로 5 회씩 녹음하여 개인용 컴퓨터(DBP400-PC313S, 삼성전자, 한국)에 저장하였다.
실험 음성은 대상자의 전방 50 cm에 둔 스피커(BR-2280 Stick, 브리츠, 한국)를 통해 표본 음성을 75 dB SPL로 출력하여 두 개의 마이크로 녹음하였다.
실험음성 녹음은 자체 제작한 두 개의 고성능 콘덴서 마이크를 이개 상부와 외이도 내부에 각각 두고, 동시에 녹음하였다.이때 스피커는 왼쪽 45°로 두었고, 출력음압은 소음계(Ling WAVES SPL meter, Wevosys, Germany)로 확인하였다.
발성은 입술로부터 20 cm 이내에 둔 마이크(SM48, Shure, USA)로 받아 CSL, MDVP의 음량지시계(volume unit meter)로 관찰하면서 5 초 동안 지속하여 충분히 연습하였다. 연습을 마친 후, 음성을 같은 방법으로 표본 비율 44,100 Hz로 5 회씩 녹음하여 개인용 컴퓨터(DBP400-PC313S, 삼성전자, 한국)에 저장하였다.
모음공간면적은 혀의 위치와 구강 및 인강에 영향을 받은 꼭지 모음(corner vowel)에 의해 결정되며, 모음삼각도의 경우 /ㅏ/, / ㅣ/, /ㅜ/의 꼭지 모음으로 결정된다. 이 연구에서는 사용빈도가 높고 이중모음 성격이 없으며, 포먼트 변화를 가장 잘 관찰할수 있는 평순중설저모음 /ㅏ/, 평순전설고모음 /ㅣ/, 원순후설고 모음 /ㅜ/를 실험 모음으로 사용하였다.
표본 음성의 포먼트 주파수는 Praat (Ver. 6.0.19, University of Amsterdam, Netherlands)으로 분석하였으며, F1, F2, F3, F4 의 순서로 /ㅏ/가 734, 1,130, 3,223, 3,982 Hz, /ㅣ/는 241, 771, 2,805, 3,947 Hz, /ㅜ/가 272, 945, 2,997, 4,396 Hz로 각각 관찰되었다 <표 1>.
대상 데이터
실험 모음은 청자에게 들려주기 위하여 청력과 음성, 발성 및조음 능력이 정상인 24 세 여자 대학생 음성으로 녹음하였고, 이를 표본 음성으로 정의하였다. 표본 음성은 장치로 재생하여 연구 참여자 외이도 내부에서 녹음하였고, 이를 실험 음성으로 정의하였다.
표본 음성은 언어병리학을 전공하고 잘 교육 받은 24세 여자 대학생이 방음실(120a, Industrial Acoustic Company, USA)에서 Computerized Speech Lab (CSL-4500, Kay Pentax, USA), Multi Dimensional Voice Program (MDVP-5105, ver 3.3)를 사용하여 녹음하였다.
화자는 언어병리학을 전공하고 잘 교육받은 24 세 여자이었고, 청자는 22세부터 30세 사이(26±4)의 15 명(남:여=12:3)이었다.
데이터처리
두 실험 음성 각각의 포먼트 주파수 F1, F2, F3, F4는 기술통계 하였고, 두 실험 음성 사이의 관계는 대응표본 t - test (SPSS 22.0)로 검증하였다.
19, University of Amsterdam, Netherlands)으로 분석하였다. 분석 구간은 청각음 성학 전공 교수와 언어병리학 전문가가 안정된 구간을 육안으로 확인한 후, 가장 안정된 0.1초 범위를 정하여 분석하였고, 포먼트 주파수는 이 구간의 평균값으로 하였다.
실험 음성의 포먼트 주파수는 Praat (Version 6.0.19, University of Amsterdam, Netherlands)으로 분석하였다. 분석 구간은 청각음 성학 전공 교수와 언어병리학 전문가가 안정된 구간을 육안으로 확인한 후, 가장 안정된 0.
성능/효과
결론적으로 실이에서 여자 음성은 /ㅏ/의 F1과 F2는 낮아지고, /ㅣ/의 F2와 /ㅜ/의 F1, F2가 높아지며, /ㅏ/, /ㅣ/, /ㅜ/의 F3, F4는 모두 낮아지는 변화를 보였다. 실이에서의 이러한 변화는 외이의 모양과 맹관 공명과 관련되는 것으로, 공명은 포먼트 주파수를 중심화 시켜 말소리 이해와 음색 및 개인별 특징 등 고급 음성 해석에 기여하는 것으로 판단된다.
두 실험 음성을 비교하면 실이 음성은 /ㅏ/의 경우 모든 포먼트 주파수가 낮아졌고, 통계적으로도 유의한 차이가 관찰되었다(p=0.000). 계속하여 /ㅣ/는 F1과 F2가 낮아졌고, F3과 F4가 낮아졌으나 통계적으로는 F1(p=0.
모든 연구 참여자들의 고막운동도는 검사 상 외이도 용적(1.04 ± 0.22 ㏄), 중이강 압력(-11.3 ± 7.19 da㎩), 정적 탄성(0.5 ± 0.24 ㏄) 등이 모두 정상 범위에 있는 Type A형을 보였다.
실험 음성의 포먼트 주파수를 살펴보면, 음장에서 녹음한 실험 음성은 F1, F2, F3, F4의 순서로 음장에서 /ㅏ/가 927.87, 1,213.95, 3,686.19, 4,685.55 Hz, /ㅣ/는 325.8, 602.23, 2,834.49, 3,853.23 Hz, /ㅜ/가 321.99, 913.16, 2,923.35, 4,227.8 Hz로 각각 관찰되었다<표1>.
이들은 모두 외이 기형을 포함한 귀 및 두경부 외상 경험이 없었고, 청력, 발성, 조음, 음성 등에 이상이 없는 전신이 건강한 대학생들이었다. 특히, 모음을 연장 발성한 화자 음성은 음향학적 검사 결과가 모두 정상 범위에 있었고, 자음정확도, 모음정확도 및 구어명료도가 모두 정상 범위에 있었다.
후속연구
특히, 보청기 사용자의 경우 공명 손실에 의한 고음역 음소 이해력 향상을 위한 주파수 범위 관련 연구에 단서로 활용할 수 있을 것이다. 연구 결과를 향후 효과적으로 활용하기 위해서는 남성 화자 및 다화자 음성에 대한 변화를 확인하는 것이 필요할 것이다.
그러나 이 연구 결과는 공명에 의한 증폭뿐 아니라 포먼트 주파수를 중이 공명 주파수 범위로 주파수를 모아주는 것(중심화 현상)을 의미한다. 중심화 현상은 청각기관에서 소리에너지 전달 효율을 높이고, 음성을 높음 품질로 해석하는데 기여할 수 있을 것으로 판단된다. 특히, 보청기 사용자의 경우 공명 손실에 의한 고음역 음소 이해력 향상을 위한 주파수 범위 관련 연구에 단서로 활용할 수 있을 것이다.
중심화 현상은 청각기관에서 소리에너지 전달 효율을 높이고, 음성을 높음 품질로 해석하는데 기여할 수 있을 것으로 판단된다. 특히, 보청기 사용자의 경우 공명 손실에 의한 고음역 음소 이해력 향상을 위한 주파수 범위 관련 연구에 단서로 활용할 수 있을 것이다. 연구 결과를 향후 효과적으로 활용하기 위해서는 남성 화자 및 다화자 음성에 대한 변화를 확인하는 것이 필요할 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
외이는 어떻게 구성되는가?
외이는 이개(pinna), 이개강(concha cavity), 외이도(external auditory canal) 등으로 구성된다. 이개는 두개골에서 돌출된 연골 등이 깔때기 모양으로 이개강을 이루며, 이개 연골이 만든 관이 골부까지 계속하여 외이도를 만들어 고막에 의해 막히는 맹관을 이룬다.
모음이란 무엇인가?
모음은 성대 진동에 의한 기류가 인두나 구강을 지나는 유성음이다. 혀의 앞뒤 위치에 따라 전설·후설로, 혀의 높낮이에 따라 고·저모음으로, 입술이 둥글거나 평평한가에 따라 원순·평순으로 구분한다.
청각기관에서 에너지 손실과 증폭은 어떻게 발생되는가?
청각기관은 공기 중 소리를 뇌가 분석할 수 있도록 에너지를 변환하며, 변환과정에서 손실된 에너지를 보상하는 증폭기관이다. 에너지 손실은 소리가 공기, 뼈, 림프 등 매질 특성이 다른 해부학적 구조물을 지나면서 발생하며, 증폭은 외이 및 중이 공명, 내이에서의 기계-전기적 전달(mechanoelectric transduction) 과정에서 발생한다. 청각기관에서 소리가 공기를 매질로 전파되는 곳은 외이이며, 외이에서의 음향 간섭은 포먼트에 영향을 줄 수 있다.
참고문헌 (17)
Kent, R., & Read, C. (2003). The acoustic analysis of speech. New York: Thompson Learning.
IseiJaakkola, T., Naka, T., & Hirose, K. (2010). Comparison of the formant frequencies F3 and F4 on a threedimensional vowel chart. The Journal of the Acoustical Society of America, 127(3), 2019
Ladefoged, P. (1993). A course in phonetics (3rd edition). Fort Worth: Harcourt Brace Jovanovich College Publishers.
Kim, Y., Kim, K., Kim, J., & Jang, J. (2013). A Study on the Formant Comparison of Korean Monophthongs according to Age and Gender -A Survey on Patients in Oriental Hospitals. Phonetics and Speech Sciences, 5(1), 73-80. (김영수.김근호.김종열.장준수 (2013). 연령 및 성별에 따른 한국인 단모음 포먼트 비교에 관한 연구-한방병원 내원환자를 중심으로. 말소리와 음성과학, 5(1), 73-80.)
Oh, E. (2012). Effects of Speaker Gender on Vowel Space Size and Vowel Changes in Korean. The Journal of Studies in Language, 28(3), 531-553. (오은진 (2012). 모음 공간의 크기 및 모음 변화에 대한 화자성별의 효과-한국어의 경우. 언어연구, 28(3), 531-553.)
Lee, J., Jang, H., & Chung, H. (2005). A Study on Frequency Characteristics of Korean Phonemes. Audiology, 1(1), 59-66. (이주현.장현숙.정한진 (2005). 한국어 음소의 주파수 특성에 관한 연구. 청능재활, 1(1), 59-66.)
Choi, A., Lee, M., Choi, A., & Heo, S. (2009). Resonance Changes in the External Auditory Canal Associated with the Ear Canal Volume. Phonetics and Speech Sciences, 1(3), 151-154. (최아현.이미소.최아름.허승덕 (2009). 외이도 용적에 따른 외이도 공명의 변화. 말소리와 음성과학, 1(3), 155-154.)
Heo, S. (2012). Pure External Auditory Canal Resonance. Journal of Speech & Hearing Disorders, 21(3), 465-473. (허승덕 (2012). 순수 외이도 공명. 언어치료연구, 21(3), 465-473.)
Heo, S., & Yoo, Y. (2004). Audiology. Busan: Dong-A University Press. (허승덕.유영상 (2004). 청각학. 부산: 동아대 학교출판부).
Heo, S., Choi, A., & Kang, M. (2006). Rehabilitative Audiology:Cochlear Implant, Hearing Aids, Binaural Hearing. Seoul: Sigma Press. (허승덕.최아현.강명구 (2006). 재활청각학: 인공와우, 보청기, 양이 청취. 서울: 시그마프레스.)
Heo, S., Yoo, J., Jeong, S., & Lee, M. (2016). Change of Formant Frequencies in Real Ear. Proceedings of the 2015 Conference of the Korean Society of Speech-Language Pathology and Audiology (pp. 76-77). (허승덕.유재형.정세인.이민희 (2016). 실이에서 음영대 주파수 변화. 2016 한국언어청각임상학회 학술대회 발표논문집, 76-77.)
Heo, S., Kang, H., & Ko, D. (2016). Male Voice Formant Frequency of High Frequency Vowel in Real Ear. Proceedings of the 4th International Conference of the Korean Speech-Language & Hearing Association (pp. 192-194). (허승덕.강희라.고도흥 (2016). 실이에서 고빈도 모음의 포먼트 주파수. 한국언어치료학회 국제학술대회 발표논문집, 192-194.)
Yi, S. (2011). An Analysis of Formants Extracted from Emotional Speech and Acoustical Implications for the Emotion Recognition System and Speech Recognition System. Phonetics and Speech Sciences, 3(1), 45-50. (이서배 (2011). 독일어 감정음성에서 추출한 포먼트의 분석 및 감정인식 시스템과 음성인식 시스템에 대한 음향적 의미, 말소리와 음성과학, 3(1), 45-50.)
Jang, I., Park, M., Kim, T., & Park, M. (2004). Study of Emotion in Speech. Proceedings of the Conference of the Korean Society Of Precision Engineering (pp. 25-28). (장인창.박미경.김태수.박면웅 (2004). 감정변화에 따른 음성정보 분석에 관한 연구. 한국 정밀공학회 학술발표대회 논문집, 25-28.)
Yang, B. (1998). A Study on Vowel Formant Variation by Vocal Tract Modification. Speech Sciences, 3, 83-92. (양병곤 (1998). 성도 변형에 따른 모음 포먼트 변화 고찰. 음성과학, 3, 83-92.)
Cho. S. (2003). An Acoustic Study of Korean Vowel System. Journal of Korean Language and Culture, 24, 427-441. (조성문 (2003). 현대 국어의 모음 체계에 대한 음향음성학적인 연구. 한국언어문화, 24, 427-441.)
※ AI-Helper는 부적절한 답변을 할 수 있습니다.