[논문]보청기에서 음성 대비 강조에 의해 발생할 수 있는 마스킹 현상

전유용; 양동권; 방동혁; 길세기; 이상민

문제 정의

본 연구에서는, 실제 음성의 대비 강조로 인한 마스킹 발생을 측정하였다. 또한 음성에서의 마스킹과 비교하고, 정량화하기 위해 순음과 협대역 잡음을 이용하여 음성에서 발생하는 마스킹과 비교하는 작업을 수행하였다.

제안 방법

1음절 및 2음절 단어는 발음이 정확한 남자에 의해 녹음된 음성이며, 순음 및 협대역 잡음은 Cool Edit Pro 2.1 로 만들었다. Cool Edit 상에서의 크기값과 실제 dB SPL 단위로의 환산하기 위해 Bruel사의 2250B 사운드 레벨 메터 (sound level meter)를 사용하였다.
도입하였다[7]. LLRe 원신호와 향상된 신호의 포먼트 사이의 불일치를 스펙트럼에서 측정한 것이다. LLR 측정은 다음과 같이 계산된다.
25가지 음성으로 이루어져있다. 각 세트의 음성에는 포먼트의 크기를 조절하기 위해서 다른 가중치를 적용하였으며, 실험에서는 가중치를 많이 준 세트, 즉 원본 음성으로부터 왜곡이 큰 세트부터 시작하고 각 세트의 음성은 피험자에게 한 세트 내에서 무작위로 재생되어 학습 효과를 줄이도록 하였다. 실험에서 사용한 2음절 단어 및 1음절 단어는 병원에서 사용하는 어음 청취 역치 (speech reception threshold, SRT) 검사 및 낱말 분별력 (word recognition score, WRS) 검사에 쓰이는 단어를 사용하였다.
검사에 사용한 2음절 단어는 병원에서 어음 청취 역치 검사에 사용하는 2음절 단어를 사용하였다. 또한 어음 청취 역치에서 30~40dB 높인 소리 크기는 쾌적 역치 (comfortable level, CL)라고 임의로 정하고 피험자에게 소리의 크기를 적당한지 물어보는 과정을 반복하여 쾌적 역치를 재조정했다.
발생을 측정하였다. 또한 음성에서의 마스킹과 비교하고, 정량화하기 위해 순음과 협대역 잡음을 이용하여 음성에서 발생하는 마스킹과 비교하는 작업을 수행하였다.
실험에서 마스커로 쓰일 협대역 잡음은 백색 잡음(white noiseX 대역 통과 필터 (band pass filter)를 통해 만들어졌으며, 프로브로 쓰일 순음은 순음 검사에 .사용되는 주파수와 사용한 음성에서의 평균 포먼트 주파수에 맞게 만들었다.
순음 마스킹 검사는 순음에서 사용하는 주파수 (500Hz, 1kHz, 2kHz, 4kHz)의 순음과 협대역 잡음을 이용한 마스킹 검사로 마스킹이 얼마나 각 주파수의 마스커에 의해서 얼마나 마스킹 되는지 조사하는 검사로 마스커와 프로브를 합친 소리와 마스커 소리가 같은지 혹은 다른지를 피험자에게 판단하도록 하여 마스커에 의해서 프로브가 마스킹 되어 들리지 않는지를 알아보았다. 만약 두 소리가 같다고 대답할 경우 마스커에 의해 프로브가 마스킹 되었다는 의미가 될 것이고, 두 소리가 다르다고 대답할 경우는 그 반대의 의미가 될 것이다.
어음 마스킹 검사는 실제 녹음한 어음을 이용하여 포먼트들 사이에서 마스킹이 발생하는지 확인하는 실험으로 사용한 어음은 어음 청취 역치 검사에서 사용한 2음절 단어를 2.2에서 설명한 방법으로 포먼트를 향상 시켜 사용하였다. 이 검사에서는 피험자에게 각 세트의 어음을 들려주고 따라 하도록하여 각 어음과 세트에 대한 전체 피험자의 정답률 평균을 산출하였다.
어음 청취 역치 검사는 2음절 단어를 이용하여들을 수 있는 최소한의 소리 크기, 즉 역치를 측정하는 검사로 4단어가 한 세트이며 그 중 세 단어 즉 70%의 정답률을 보이는 소리의 크기를 역치로 정하였다. 검사에 사용한 2음절 단어는 병원에서 어음 청취 역치 검사에 사용하는 2음절 단어를 사용하였다.
2에서 설명한 방법으로 포먼트를 향상 시켜 사용하였다. 이 검사에서는 피험자에게 각 세트의 어음을 들려주고 따라 하도록하여 각 어음과 세트에 대한 전체 피험자의 정답률 평균을 산출하였다. 표 4는 어음 마스킹 검사의 결과를 나타내고 있다.
만약 두 소리가 같다고 대답할 경우 마스커에 의해 프로브가 마스킹 되었다는 의미가 될 것이고, 두 소리가 다르다고 대답할 경우는 그 반대의 의미가 될 것이다. 이런 과정을 반복하여 마스커 존재하의 프로브의 역치를 산출하였다. 그림 5는 그 결과를 나타낸다.
본 연구에서는 FFT 이후 15차 LPC를 사용했으며, LPC 사용 후 포먼트라 불리는 주파수 축에서의 몇몇 피크가 나타난다. 이를 증가시켜주기 위해서 변형된 해밍 윈도우(hamming window)를 사용하여, 포먼트라고 생각되는 부분에는 가중치를 많이 주고 그렇지 않은 부분은 전체 이득을 조절해서 작게 만들어주었다. 주파수 축에서의 크기 (amplitude)에 이와 같은 과정을 취하고, 위상(phase)는 원신호의 FFT 이후의 위상을 그대로 사용하여 IFFT를 하여, 포먼트가 강조된 신호를 만들었다.
이를 증가시켜주기 위해서 변형된 해밍 윈도우(hamming window)를 사용하여, 포먼트라고 생각되는 부분에는 가중치를 많이 주고 그렇지 않은 부분은 전체 이득을 조절해서 작게 만들어주었다. 주파수 축에서의 크기 (amplitude)에 이와 같은 과정을 취하고, 위상(phase)는 원신호의 FFT 이후의 위상을 그대로 사용하여 IFFT를 하여, 포먼트가 강조된 신호를 만들었다. 포먼트는 음성을 구분하는데 가장 영향력 있는, 낮은 주파수로부터 3 개의 포먼트를 강조시켰다.
포먼트 주파수는 어음 청취 역치 검사에서 사용하는 25개의 단어들의 포먼트를 기준으로 250Hz, 770Hz, 2000Hz, 3개의 주파수를 대상으로 마스킹 검사를 수행하였다. 검사 방식은 3.

대상 데이터

1 로 만들었다. Cool Edit 상에서의 크기값과 실제 dB SPL 단위로의 환산하기 위해 Bruel사의 2250B 사운드 레벨 메터 (sound level meter)를 사용하였다. 실험에서 마스커로 쓰일 협대역 잡음은 백색 잡음(white noiseX 대역 통과 필터 (band pass filter)를 통해 만들어졌으며, 프로브로 쓰일 순음은 순음 검사에 .
검사에 사용한 2음절 단어는 병원에서 어음 청취 역치 검사에 사용하는 2음절 단어를 사용하였다. 또한 어음 청취 역치에서 30~40dB 높인 소리 크기는 쾌적 역치 (comfortable level, CL)라고 임의로 정하고 피험자에게 소리의 크기를 적당한지 물어보는 과정을 반복하여 쾌적 역치를 재조정했다.
조사하는 검사다. 실험에 사용한 순음은 순음 테스트에서 사용한 500Hz, 1kHz, 2kHz, 4kHz, 8kHz로 구성되어 있다. 그림 4는 실험에 참가한 정상 청각 피험자와 난청인 피험자의 평균 순음 청력도를 나타낸 것으로 난청인 피험자들은 고주파수에 역치가 감소하는 노인성 난청을 갖고 있음을 알 수 있다.
실험에 쓰인 자극 및 음성은 순음, 2음절 단어, 1 음절 단어, 협대역 잡음, 포먼트를 강조한 2음절 음성이다. 1음절 및 2음절 단어는 발음이 정확한 남자에 의해 녹음된 음성이며, 순음 및 협대역 잡음은 Cool Edit Pro 2.
Cool Edit 상에서의 크기값과 실제 dB SPL 단위로의 환산하기 위해 Bruel사의 2250B 사운드 레벨 메터 (sound level meter)를 사용하였다. 실험에서 마스커로 쓰일 협대역 잡음은 백색 잡음(white noiseX 대역 통과 필터 (band pass filter)를 통해 만들어졌으며, 프로브로 쓰일 순음은 순음 검사에 .사용되는 주파수와 사용한 음성에서의 평균 포먼트 주파수에 맞게 만들었다.
실험에서 사용되는 포먼트가 향상된 음성은 총 4 가지의 음성 세트로 구성되고, 각각의 음성 세트에는 25가지 음성으로 이루어져있다. 각 세트의 음성에는 포먼트의 크기를 조절하기 위해서 다른 가중치를 적용하였으며, 실험에서는 가중치를 많이 준 세트, 즉 원본 음성으로부터 왜곡이 큰 세트부터 시작하고 각 세트의 음성은 피험자에게 한 세트 내에서 무작위로 재생되어 학습 효과를 줄이도록 하였다.
표 1은 실험에 참가한 피험자에 대한 정보를 나타낸 것으로, 정상 청각 피험자 27명(남자 11명, 여자 16명), 난청 피험자 27명(여자 20명, 남자 7명)이 참가하였다. 정상 청각 피험자의 평균 연령은 약 23.

이론/모형

각 세트의 음성에는 포먼트의 크기를 조절하기 위해서 다른 가중치를 적용하였으며, 실험에서는 가중치를 많이 준 세트, 즉 원본 음성으로부터 왜곡이 큰 세트부터 시작하고 각 세트의 음성은 피험자에게 한 세트 내에서 무작위로 재생되어 학습 효과를 줄이도록 하였다. 실험에서 사용한 2음절 단어 및 1음절 단어는 병원에서 사용하는 어음 청취 역치 (speech reception threshold, SRT) 검사 및 낱말 분별력 (word recognition score, WRS) 검사에 쓰이는 단어를 사용하였다.
어음 마스킹에 사용된 포먼트가 향상된 어음의 왜곡을 측정하기 위해서 log likelihood ratio(LLR)을 도입하였다[7]. LLRe 원신호와 향상된 신호의 포먼트 사이의 불일치를 스펙트럼에서 측정한 것이다.
간단한 방법을 사용하였다. 포먼트 분석을 위해서 선형 예측 부호화(linear predictive coding, LPC) 알고리즘을 사용하였다. LPC는 주어진 시점 n에서 음성 신호는 지나간 p개의 음성신호의 linear combination으로 근사할 수 있다는 기본 가정으로 시작하며 식으로 나타내면 식 (1)과 같다.

성능/효과

표 3의 첫 번째 행은 마스커의 주파수를 나타내고, 두 번째 행은 프로브의 주파수, 세 번째 행은 프로브 역치에서의 마스커와 프로브의 레벨 차이를 나타내고 있다. 결과에서 보면 차이가 적을수록 마스킹이 잘 일어난다는 의미가 되고 첫 번째 포먼트라고 가정한 2500Hz에서 두 번째 포먼트라고 가정한 770Hz로의 마스킹이 가장 잘 일어난다는 확인할 수 있다.
그들의 결과는 주파수 영역에서 상대적으로 저주파가 고주파를 마스킹하는 상향 마스킹이 하향 마스킹보다 넓다는 것을 보였다. 그림 1은 그들의 실험결과를 나타내는 그림으로 각 피험자데이터를 평균한 값을 그래프로 그린 것이다.
이 논문에서, 디지털 보청기에 의해서 강조된 음성에서 포먼트에 의해서 마스킹이 일어나고, 그로 인해서 음성 인지에 어려움이 생길 수 있다는 것을 말하기 위해서 음성을 강조하여 음성의 인지율이 떨어지는 것을 보였다. 표 2에서 보면 난청인 피험자와 정상 청각 피험자 사이에서 낱말 분별력이 크게 다르지 않다는 것을 알 수 있다(4% 이내).
정상 청각 피험자의 평균 연령은 약 23.2세, 난청인 피험자의 평균 연령은 74.6세로 나타났다. 그림 4는 정상 청각 피험자와 난청인 피험자의 순음 검사 결과를 나타낸 것이다.
그림 7은 어음 마스킹 실험에서 피험자들의 대부분이 정답을 맞히지 못하는 음성을 주파수 분석을 하고 선형 예측 부호화 알고리즘을 통한 결과이다. 첫 번째 포먼트(약 250Hz)와 두 번째 포먼트(약 770Hz)의 차이를 보면 약 35dB 정도의 차이가 난다는 것을 알 수 있고 이것은 순음 마스킹 검사의 결과와 거의 일치하는 값이라고 볼 수 있다. 이로서 순음 마스킹 검사 결과와 어음 마스킹 검사 결과가 연관성이 있다고 생각할 수 있다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

보청기에서 음성 대비 강조에 의해 발생할 수 있는 마스킹 현상
Acoustic Masking Effect That Can Be Occurred by Speech Contrast Enhancement in Hearing Aids 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

보청기에서 음성 대비 강조에 의해 발생할 수 있는 마스킹 현상 Acoustic Masking Effect That Can Be Occurred by Speech Contrast Enhancement in Hearing Aids 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

이 논문을 인용한 문헌

저자의 다른 논문 :

전유용 (12) 양동권 (1) 방동혁 (4) 길세기 (8) 이상민 (79)

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

보청기에서 음성 대비 강조에 의해 발생할 수 있는 마스킹 현상
Acoustic Masking Effect That Can Be Occurred by Speech Contrast Enhancement in Hearing Aids 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper