대부분의 보청기에서는 난청인의 청력 손실을 보상하기 위해 음성 증폭 알고리즘과 잡음 및 피드백을 제거하기 위한 알고리즘 등을 사용하고 있고, 음성의 인지율을 높이기 위해서 음성의 대비를 강조하는 알고리즘을 사용한다. 음성 대비 강조 알고리즘 사용 시 과도한 대비증폭에 의해서 포먼트(formant) 사이에서 마스킹 현상이 발생할 수 있다. 마스킹 현상을 확인하기 위해서 6가지의 주관적인 평가와 1가지의 객관적인 평가를 수행하였다. 주관적인 평가로는 순음 검사, 어음 청취 역치 검사, 낱말 분별력 검사, 순음 마스킹 검사, 포먼트 순음 마스킹 검사, 어음 마스킹 검사로 이루어져있고 객관적인 평가를 위해서 LLR(loglikelihood ratio)을 도입하였다. 정상 청각 피험자와 난청 피험자의 결과로 미루어 볼 때, 난청 피험자가 마스킹이 잘 일어난다는 것을 볼 수 있었고, 어음을 이용한 마스킹 검사에서는 마스킹에 의해서 난청 피험자에서 어음에 대한 인지율이 떨어지는 결과를 볼 수 있다. 이러한 현상은 포먼트 향상에 의한 왜곡 때문이 아닌 마스킹 때문이다. 그러므로 마스킹 효과의 특성을 조사하여, 보청기 적합 시, 이러한 마스킹 특성을 고려하는 것이 필요하다.
대부분의 보청기에서는 난청인의 청력 손실을 보상하기 위해 음성 증폭 알고리즘과 잡음 및 피드백을 제거하기 위한 알고리즘 등을 사용하고 있고, 음성의 인지율을 높이기 위해서 음성의 대비를 강조하는 알고리즘을 사용한다. 음성 대비 강조 알고리즘 사용 시 과도한 대비증폭에 의해서 포먼트(formant) 사이에서 마스킹 현상이 발생할 수 있다. 마스킹 현상을 확인하기 위해서 6가지의 주관적인 평가와 1가지의 객관적인 평가를 수행하였다. 주관적인 평가로는 순음 검사, 어음 청취 역치 검사, 낱말 분별력 검사, 순음 마스킹 검사, 포먼트 순음 마스킹 검사, 어음 마스킹 검사로 이루어져있고 객관적인 평가를 위해서 LLR(log likelihood ratio)을 도입하였다. 정상 청각 피험자와 난청 피험자의 결과로 미루어 볼 때, 난청 피험자가 마스킹이 잘 일어난다는 것을 볼 수 있었고, 어음을 이용한 마스킹 검사에서는 마스킹에 의해서 난청 피험자에서 어음에 대한 인지율이 떨어지는 결과를 볼 수 있다. 이러한 현상은 포먼트 향상에 의한 왜곡 때문이 아닌 마스킹 때문이다. 그러므로 마스킹 효과의 특성을 조사하여, 보청기 적합 시, 이러한 마스킹 특성을 고려하는 것이 필요하다.
In most of hearing aids, amplification algorithms are used to compensate hearing loss, noise and feedback reduction algorithms are used and to increase the perception of speeches contrast enhancement algorithms are used. However, acoustic masking effect is occurred between formants if contrast is en...
In most of hearing aids, amplification algorithms are used to compensate hearing loss, noise and feedback reduction algorithms are used and to increase the perception of speeches contrast enhancement algorithms are used. However, acoustic masking effect is occurred between formants if contrast is enhanced excessively. To confirm the masking effect in speeches, the experiment are composed of 6 tests; test pure tone test, speech reception test, word recognition test, pure tone masking test, formant pure tone masking test and speech masking test, and for objective evaluation, LLR is introduced. As a result of normal hearing subjects and hearing impaired subjects, more making is occurred in hearing impaired subjects than normal hearing subjects when using pure tone, and in the speech masking test, speech reception is also lower in hearing impaired subjects than in normal hearing subjects. This means that acoustic masking effect rather than distortion influences speech perception. So it is required to check the characteristics of masking effect before wearing a hearing aid and to apply this characteristics to fitting curve.
In most of hearing aids, amplification algorithms are used to compensate hearing loss, noise and feedback reduction algorithms are used and to increase the perception of speeches contrast enhancement algorithms are used. However, acoustic masking effect is occurred between formants if contrast is enhanced excessively. To confirm the masking effect in speeches, the experiment are composed of 6 tests; test pure tone test, speech reception test, word recognition test, pure tone masking test, formant pure tone masking test and speech masking test, and for objective evaluation, LLR is introduced. As a result of normal hearing subjects and hearing impaired subjects, more making is occurred in hearing impaired subjects than normal hearing subjects when using pure tone, and in the speech masking test, speech reception is also lower in hearing impaired subjects than in normal hearing subjects. This means that acoustic masking effect rather than distortion influences speech perception. So it is required to check the characteristics of masking effect before wearing a hearing aid and to apply this characteristics to fitting curve.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는, 실제 음성의 대비 강조로 인한 마스킹 발생을 측정하였다. 또한 음성에서의 마스킹과 비교하고, 정량화하기 위해 순음과 협대역 잡음을 이용하여 음성에서 발생하는 마스킹과 비교하는 작업을 수행하였다.
제안 방법
1음절 및 2음절 단어는 발음이 정확한 남자에 의해 녹음된 음성이며, 순음 및 협대역 잡음은 Cool Edit Pro 2.1 로 만들었다. Cool Edit 상에서의 크기값과 실제 dB SPL 단위로의 환산하기 위해 Bruel사의 2250B 사운드 레벨 메터 (sound level meter)를 사용하였다.
도입하였다[7]. LLRe 원신호와 향상된 신호의 포먼트 사이의 불일치를 스펙트럼에서 측정한 것이다. LLR 측정은 다음과 같이 계산된다.
25가지 음성으로 이루어져있다. 각 세트의 음성에는 포먼트의 크기를 조절하기 위해서 다른 가중치를 적용하였으며, 실험에서는 가중치를 많이 준 세트, 즉 원본 음성으로부터 왜곡이 큰 세트부터 시작하고 각 세트의 음성은 피험자에게 한 세트 내에서 무작위로 재생되어 학습 효과를 줄이도록 하였다. 실험에서 사용한 2음절 단어 및 1음절 단어는 병원에서 사용하는 어음 청취 역치 (speech reception threshold, SRT) 검사 및 낱말 분별력 (word recognition score, WRS) 검사에 쓰이는 단어를 사용하였다.
검사에 사용한 2음절 단어는 병원에서 어음 청취 역치 검사에 사용하는 2음절 단어를 사용하였다. 또한 어음 청취 역치에서 30~40dB 높인 소리 크기는 쾌적 역치 (comfortable level, CL)라고 임의로 정하고 피험자에게 소리의 크기를 적당한지 물어보는 과정을 반복하여 쾌적 역치를 재조정했다.
발생을 측정하였다. 또한 음성에서의 마스킹과 비교하고, 정량화하기 위해 순음과 협대역 잡음을 이용하여 음성에서 발생하는 마스킹과 비교하는 작업을 수행하였다.
실험에서 마스커로 쓰일 협대역 잡음은 백색 잡음(white noiseX 대역 통과 필터 (band pass filter)를 통해 만들어졌으며, 프로브로 쓰일 순음은 순음 검사에 .사용되는 주파수와 사용한 음성에서의 평균 포먼트 주파수에 맞게 만들었다.
순음 마스킹 검사는 순음에서 사용하는 주파수 (500Hz, 1kHz, 2kHz, 4kHz)의 순음과 협대역 잡음을 이용한 마스킹 검사로 마스킹이 얼마나 각 주파수의 마스커에 의해서 얼마나 마스킹 되는지 조사하는 검사로 마스커와 프로브를 합친 소리와 마스커 소리가 같은지 혹은 다른지를 피험자에게 판단하도록 하여 마스커에 의해서 프로브가 마스킹 되어 들리지 않는지를 알아보았다. 만약 두 소리가 같다고 대답할 경우 마스커에 의해 프로브가 마스킹 되었다는 의미가 될 것이고, 두 소리가 다르다고 대답할 경우는 그 반대의 의미가 될 것이다.
어음 마스킹 검사는 실제 녹음한 어음을 이용하여 포먼트들 사이에서 마스킹이 발생하는지 확인하는 실험으로 사용한 어음은 어음 청취 역치 검사에서 사용한 2음절 단어를 2.2에서 설명한 방법으로 포먼트를 향상 시켜 사용하였다. 이 검사에서는 피험자에게 각 세트의 어음을 들려주고 따라 하도록하여 각 어음과 세트에 대한 전체 피험자의 정답률 평균을 산출하였다.
어음 청취 역치 검사는 2음절 단어를 이용하여들을 수 있는 최소한의 소리 크기, 즉 역치를 측정하는 검사로 4단어가 한 세트이며 그 중 세 단어 즉 70%의 정답률을 보이는 소리의 크기를 역치로 정하였다. 검사에 사용한 2음절 단어는 병원에서 어음 청취 역치 검사에 사용하는 2음절 단어를 사용하였다.
2에서 설명한 방법으로 포먼트를 향상 시켜 사용하였다. 이 검사에서는 피험자에게 각 세트의 어음을 들려주고 따라 하도록하여 각 어음과 세트에 대한 전체 피험자의 정답률 평균을 산출하였다. 표 4는 어음 마스킹 검사의 결과를 나타내고 있다.
만약 두 소리가 같다고 대답할 경우 마스커에 의해 프로브가 마스킹 되었다는 의미가 될 것이고, 두 소리가 다르다고 대답할 경우는 그 반대의 의미가 될 것이다. 이런 과정을 반복하여 마스커 존재하의 프로브의 역치를 산출하였다. 그림 5는 그 결과를 나타낸다.
본 연구에서는 FFT 이후 15차 LPC를 사용했으며, LPC 사용 후 포먼트라 불리는 주파수 축에서의 몇몇 피크가 나타난다. 이를 증가시켜주기 위해서 변형된 해밍 윈도우(hamming window)를 사용하여, 포먼트라고 생각되는 부분에는 가중치를 많이 주고 그렇지 않은 부분은 전체 이득을 조절해서 작게 만들어주었다. 주파수 축에서의 크기 (amplitude)에 이와 같은 과정을 취하고, 위상(phase)는 원신호의 FFT 이후의 위상을 그대로 사용하여 IFFT를 하여, 포먼트가 강조된 신호를 만들었다.
이를 증가시켜주기 위해서 변형된 해밍 윈도우(hamming window)를 사용하여, 포먼트라고 생각되는 부분에는 가중치를 많이 주고 그렇지 않은 부분은 전체 이득을 조절해서 작게 만들어주었다. 주파수 축에서의 크기 (amplitude)에 이와 같은 과정을 취하고, 위상(phase)는 원신호의 FFT 이후의 위상을 그대로 사용하여 IFFT를 하여, 포먼트가 강조된 신호를 만들었다. 포먼트는 음성을 구분하는데 가장 영향력 있는, 낮은 주파수로부터 3 개의 포먼트를 강조시켰다.
포먼트 주파수는 어음 청취 역치 검사에서 사용하는 25개의 단어들의 포먼트를 기준으로 250Hz, 770Hz, 2000Hz, 3개의 주파수를 대상으로 마스킹 검사를 수행하였다. 검사 방식은 3.
대상 데이터
1 로 만들었다. Cool Edit 상에서의 크기값과 실제 dB SPL 단위로의 환산하기 위해 Bruel사의 2250B 사운드 레벨 메터 (sound level meter)를 사용하였다. 실험에서 마스커로 쓰일 협대역 잡음은 백색 잡음(white noiseX 대역 통과 필터 (band pass filter)를 통해 만들어졌으며, 프로브로 쓰일 순음은 순음 검사에 .
검사에 사용한 2음절 단어는 병원에서 어음 청취 역치 검사에 사용하는 2음절 단어를 사용하였다. 또한 어음 청취 역치에서 30~40dB 높인 소리 크기는 쾌적 역치 (comfortable level, CL)라고 임의로 정하고 피험자에게 소리의 크기를 적당한지 물어보는 과정을 반복하여 쾌적 역치를 재조정했다.
조사하는 검사다. 실험에 사용한 순음은 순음 테스트에서 사용한 500Hz, 1kHz, 2kHz, 4kHz, 8kHz로 구성되어 있다. 그림 4는 실험에 참가한 정상 청각 피험자와 난청인 피험자의 평균 순음 청력도를 나타낸 것으로 난청인 피험자들은 고주파수에 역치가 감소하는 노인성 난청을 갖고 있음을 알 수 있다.
실험에 쓰인 자극 및 음성은 순음, 2음절 단어, 1 음절 단어, 협대역 잡음, 포먼트를 강조한 2음절 음성이다. 1음절 및 2음절 단어는 발음이 정확한 남자에 의해 녹음된 음성이며, 순음 및 협대역 잡음은 Cool Edit Pro 2.
Cool Edit 상에서의 크기값과 실제 dB SPL 단위로의 환산하기 위해 Bruel사의 2250B 사운드 레벨 메터 (sound level meter)를 사용하였다. 실험에서 마스커로 쓰일 협대역 잡음은 백색 잡음(white noiseX 대역 통과 필터 (band pass filter)를 통해 만들어졌으며, 프로브로 쓰일 순음은 순음 검사에 .사용되는 주파수와 사용한 음성에서의 평균 포먼트 주파수에 맞게 만들었다.
실험에서 사용되는 포먼트가 향상된 음성은 총 4 가지의 음성 세트로 구성되고, 각각의 음성 세트에는 25가지 음성으로 이루어져있다. 각 세트의 음성에는 포먼트의 크기를 조절하기 위해서 다른 가중치를 적용하였으며, 실험에서는 가중치를 많이 준 세트, 즉 원본 음성으로부터 왜곡이 큰 세트부터 시작하고 각 세트의 음성은 피험자에게 한 세트 내에서 무작위로 재생되어 학습 효과를 줄이도록 하였다.
표 1은 실험에 참가한 피험자에 대한 정보를 나타낸 것으로, 정상 청각 피험자 27명(남자 11명, 여자 16명), 난청 피험자 27명(여자 20명, 남자 7명)이 참가하였다. 정상 청각 피험자의 평균 연령은 약 23.
이론/모형
각 세트의 음성에는 포먼트의 크기를 조절하기 위해서 다른 가중치를 적용하였으며, 실험에서는 가중치를 많이 준 세트, 즉 원본 음성으로부터 왜곡이 큰 세트부터 시작하고 각 세트의 음성은 피험자에게 한 세트 내에서 무작위로 재생되어 학습 효과를 줄이도록 하였다. 실험에서 사용한 2음절 단어 및 1음절 단어는 병원에서 사용하는 어음 청취 역치 (speech reception threshold, SRT) 검사 및 낱말 분별력 (word recognition score, WRS) 검사에 쓰이는 단어를 사용하였다.
어음 마스킹에 사용된 포먼트가 향상된 어음의 왜곡을 측정하기 위해서 log likelihood ratio(LLR)을 도입하였다[7]. LLRe 원신호와 향상된 신호의 포먼트 사이의 불일치를 스펙트럼에서 측정한 것이다.
간단한 방법을 사용하였다. 포먼트 분석을 위해서 선형 예측 부호화(linear predictive coding, LPC) 알고리즘을 사용하였다. LPC는 주어진 시점 n에서 음성 신호는 지나간 p개의 음성신호의 linear combination으로 근사할 수 있다는 기본 가정으로 시작하며 식으로 나타내면 식 (1)과 같다.
성능/효과
표 3의 첫 번째 행은 마스커의 주파수를 나타내고, 두 번째 행은 프로브의 주파수, 세 번째 행은 프로브 역치에서의 마스커와 프로브의 레벨 차이를 나타내고 있다. 결과에서 보면 차이가 적을수록 마스킹이 잘 일어난다는 의미가 되고 첫 번째 포먼트라고 가정한 2500Hz에서 두 번째 포먼트라고 가정한 770Hz로의 마스킹이 가장 잘 일어난다는 확인할 수 있다.
그들의 결과는 주파수 영역에서 상대적으로 저주파가 고주파를 마스킹하는 상향 마스킹이 하향 마스킹보다 넓다는 것을 보였다. 그림 1은 그들의 실험결과를 나타내는 그림으로 각 피험자데이터를 평균한 값을 그래프로 그린 것이다.
이 논문에서, 디지털 보청기에 의해서 강조된 음성에서 포먼트에 의해서 마스킹이 일어나고, 그로 인해서 음성 인지에 어려움이 생길 수 있다는 것을 말하기 위해서 음성을 강조하여 음성의 인지율이 떨어지는 것을 보였다. 표 2에서 보면 난청인 피험자와 정상 청각 피험자 사이에서 낱말 분별력이 크게 다르지 않다는 것을 알 수 있다(4% 이내).
정상 청각 피험자의 평균 연령은 약 23.2세, 난청인 피험자의 평균 연령은 74.6세로 나타났다. 그림 4는 정상 청각 피험자와 난청인 피험자의 순음 검사 결과를 나타낸 것이다.
그림 7은 어음 마스킹 실험에서 피험자들의 대부분이 정답을 맞히지 못하는 음성을 주파수 분석을 하고 선형 예측 부호화 알고리즘을 통한 결과이다. 첫 번째 포먼트(약 250Hz)와 두 번째 포먼트(약 770Hz)의 차이를 보면 약 35dB 정도의 차이가 난다는 것을 알 수 있고 이것은 순음 마스킹 검사의 결과와 거의 일치하는 값이라고 볼 수 있다. 이로서 순음 마스킹 검사 결과와 어음 마스킹 검사 결과가 연관성이 있다고 생각할 수 있다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.