$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

음성 향상에서 강인한 새로운 선행 SNR 추정 기법에 관한 연구
A Novel Approach to a Robust A Priori SNR Estimator in Speech Enhancement 원문보기

한국음향학회지= The journal of the acoustical society of Korea, v.25 no.8, 2006년, pp.383 - 388  

박윤식 (인하대학교 전자전기공학부) ,  장준혁 (인하대학교 전자전기공학부)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 잡음 환경에서 단일 마이크로폰의 음성 향상에 대한 새로운 기법을 제시했다. 일반적으로 널리 알려진 스펙트럼 차감법에 근거한 음성 향상 기술은 신호 대 잡음비에 따른 스펙트럼 이득으로 표현된다. 대표적인 Ephraim과 Malah의 decision-directed (DD) 추정치는 잡음 구간에서 효율적으로 뮤지컬 잡음을 제거하지만 음성 구간에서는 이전 프레임의 음성 스펙트럼 성분에 더 큰 비중을 두기 때문에 a priori SNR의 프레임 지연이 발생한다. 따라서 DD에 의해 추정된 a priori SNR이 적용된 잡음 제거 이득은 현재 프레임보다 이전 프레임에 영향을 받으므로 음성 전이 구간에서 잡음 제거 성능을 저하시킨다. 본 논문은 DD의 가중치 파라미터Sigmoid Type의 함수를 적용하여 계산적으로는 간단하지만 효과적인 음성 향상 알고리즘을 제안한다. 제안된 접근 방식은 DD의 주요 파라미터인 a priori SNR 지연의 문제점을 해결하면서 뮤지컬 잡음 제거에 우수한 DD의 이점은 유지한다. 제안된 알고리즘의 성능은 다양한 잡음 환경에서 ITU-T P.862 Perceptual Evaluation of Speech Quality (PESQ) 와 Mean Opinion Score (MOS). 그리고 음성 스펙트로그램 (Spectrogram)에 의해 평가했고 기존의 DD의 고정된 가중치 파라미터를 사용했을 때 보다 향상된 결과를 나타내었다.

Abstract AI-Helper 아이콘AI-Helper

This Paper presents a novel approach to single channel microphone speech enhancement in noisy environments. Widely used noise reduction techniques based on the spectral subtraction are generally expressed as a spectral gam depending on the signal-to-noise ratio (SNR). The well-known decision-directe...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 Sigmoid Type의 함수를 기존 DD의 고정 가중치 파라미터에 적용하는 새로운 알고리즘을 제안 하였다. 기존의 방법은 이전 프레임에 큰 가중치를 주어 잡음 구간에서의 뮤지컬 잡음 제거에는 탁월한 성능을 보였지만 음성 전이 구간에서는 주요 파라미터인 a pHM SNR의 지연이 생기게 된다.
  • 본 논문에서는 Sigmoid Type의 함수를 기존 DD의 고정 가중치 파라미터에 적용하는 새로운 알고리즘을 제안 하였다. 기존의 방법은 이전 프레임에 큰 가중치를 주어 잡음 구간에서의 뮤지컬 잡음 제거에는 탁월한 성능을 보였지만 음성 전이 구간에서는 주요 파라미터인 a pHM SNR의 지연이 생기게 된다.
  • 본 논문에서는 기존 DD 알고리즘에서 발생되는 음성 전이 구간에서 a priori SNR 파라미터의 지연에 의한 잡음 제거 이득의 왜곡을 감소시킴으로써 개선된 음성 향상을 유도 하였다 [10][11]. 제안된 음성 향상 알고리즘의 음질 평가를 위해 널리 적용되고 있는 ITU-T P.
  • 본 논문에서는 기존 DD 알고리즘에서 발생되는 음성 전이 구간에서 a priori SNR 파라미터의 지연에 의한 잡음 제거 이득의 왜곡을 감소시킴으로써 개선된 음성 향상을 유도 하였다 [10][11]. 제안된 음성 향상 알고리즘의 음질 평가를 위해 널리 적용되고 있는 ITU-T P.
  • 이것은 Capped 연구 결과에 기반을 둔 것으로 실제로는 DD에 의한 추정 방법은 잡음 구간에서 뮤지컬 잡음 제거와 음성 전이 구간에서 음성 왜곡 사이에 trade off가 발생된다는 사실이 보고되었다. 본 논문에서는 프레임 간의 a posteriori SNR의 변이에 따라 아래식의 Sigmoid Type 함수의 값을 DD의 가중치 파라미터 a에 적용하는 알고리즘을 제안했다.
  • 이것은 Capped 연구 결과에 기반을 둔 것으로 실제로는 DD에 의한 추정 방법은 잡음 구간에서 뮤지컬 잡음 제거와 음성 전이 구간에서 음성 왜곡 사이에 trade off가 발생된다는 사실이 보고되었다. 본 논문에서는 프레임 간의 a posteriori SNR의 변이에 따라 아래식의 Sigmoid Type 함수의 값을 DD의 가중치 파라미터 a에 적용하는 알고리즘을 제안했다.
본문요약 정보가 도움이 되었나요?

참고문헌 (11)

  1. Y. Ephraim and D. Malah, 'Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator,' IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-32, 6 1109--1121, Dec. 1984 

  2. S. F. Boll, 'Suppression of acoustic noise in speech using spectral subtraction,' IEEE Trans. Acoust., Speech, Signal Process., vol. ASSP-27, 2 113-120, Apr. 1979 

  3. R. J. McAualy and M. L. Malpass, 'Speech enhancement using a soft-decision noise suppression filter,' IEEE Trans Acoust., Speech, Signal Processing, vol. ASSP-28, 137-145, Apr. 1980 

  4. O. Cappe, 'Elimination of the musical noise phenomenon with the Ephraim and Malah noise suppressor,' IEEE Trans Speech Audio Process., 2(2) 345-349, Apr. 1994 

  5. N. Ma, M. Bouchard and R. Goubran, 'Perceptual Kalman filtering for speech enhancement in colored noise,' in Proc. IEEE Int. Conf. on Acoustic, Speech and Signal Processing, 1 717-720, Montreal, May 2004 

  6. C. You, S. N. Koh, and S. Rahardja 'Signal subspace speech enhancement for audible noise reduction', in Proc IEEE Int. Conf. Acoustics, Speech, and Signal Processing, 1 145-148, Mar. 2005 

  7. N. Virag, 'Single channel speech enhancement based on masking properties of the human auditory system,' IEEE Trans. Speech and Audio Processing, 7(2) 126-137, Mar. 1999 

  8. N. S. Kim, J.-H. Chang, 'Spectral enhancement based on global soft decision,' IEEE Signal Processing Letters, 7(5) May 2000, 108-110 

  9. J. Sohn, N. S. Kim, W. Sung, 'A statistical model-based voice activity detection,' IEEE Signal Processing Letters, 6(1) 1-3, Jan. 1999 

  10. C. Plapous, C. Marro, P. Scalart, and L. Mauuary, 'A two-step noise reduction technique, in Proc. IEEE Int. Conf. Acoust., Speech, Signal Process., Montreal, QC, Canada, May 2004, 1 289--292 

  11. I. Cohen, 'Speech enhancement using a noncausal a priori SNR estimator,' IEEE Signal Processing Letters, 11 (9) Sept. 2004. 725-728 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로