$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

마이크로폰 배열에서 독립벡터분석 기법을 이용한 잡음음성의 음질 개선
Microphone Array Based Speech Enhancement Using Independent Vector Analysis 원문보기

말소리와 음성과학 = Phonetics and speech sciences, v.4 no.4, 2012년, pp.87 - 92  

왕씽양 (경북대학교) ,  전성일 (경북대학교) ,  배건성 (경북대학교)

Abstract AI-Helper 아이콘AI-Helper

Speech enhancement aims to improve speech quality by removing background noise from noisy speech. Independent vector analysis is a type of frequency-domain independent component analysis method that is known to be free from the frequency bin permutation problem in the process of blind source separat...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 IVA를 이용한 마이크로폰 배열 기반의 음성 개선 방법을 제안하였다. 입력되는 다채널 잡음음성 신호에서 처음 1~2초 길이의 데이터로 IVA의 분리행렬을 구하고, 구해진 분리행렬을 이용하여 다채널 잡음음성에서 음성신호를 비롯하여 잡음신호들을 분리해 낸다.
  • 본 연구에서는 IVA 기법을 마이크로폰 배열에서 얻어지는 다채널 잡음음성 신호에 적용하여 잡음성분이 제거되고 향상된 음질의 음성신호를 얻는 음성개선 방법을 제안하였다. 제안한 방법에서는 먼저 다채널 잡음음성에 IVA 기법을 이용하여 잡음성분과 음성신호를 비롯한 음원신호로 분리하고, 마이크로폰 배열의 DSB(Delay-Sum Beamforming) 출력신호와 IVA로 분리된 출력신호 사이의 상관관계를 이용하여 IVA 출력신호 중에서 개선된 음성신호를 출력한다.

가설 설정

  • 제안한 방법의 음질개선 성능을 평가하기 위하여 와 같은 마이크로폰 사이의 간격이 5cm인 4-채널 마이크로폰 배열을 가정하고, 음성신호는 마이크로폰 배열의 수직방향을 기준으로 0º 방향에서, 잡음신호는 40º 방향에서 입력되는 잡음음성을 생성하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
음성개선이란 무엇인가? 다양한 형태의 배경잡음이 포함된 잡음음성에서 잡음성분을 제거하여 음질(speech quality)을 개선하는 기술을 음성개선(speech enhancement)이라고 하는데, 음성통신에서 음성의 명료도를 높이고 잡음으로 인한 청취자의 피로를 덜어주거나, 음성인식시스템의 인식성능을 향상시키기 위해 전처리 과정 등에서 사용되고 있는 기술로서 꾸준히 연구되고 있는 분야이다. 음성개선 방법으로는 크게 스펙트럽 차감법, MMSE-STSA 등과 같이 단일 채널 음성신호를 이용하는 방법[1]과 GSC(Generalized Sidelobe Canceller), DSB(Delay-Sum Beamforming) 등과 같이 마이크로폰 배열 기반의 다채널 음성 신호를 이용하는 방법[2]으로 나눌 수 있다.
음성개선 방법에는 무엇이 있는가? 다양한 형태의 배경잡음이 포함된 잡음음성에서 잡음성분을 제거하여 음질(speech quality)을 개선하는 기술을 음성개선(speech enhancement)이라고 하는데, 음성통신에서 음성의 명료도를 높이고 잡음으로 인한 청취자의 피로를 덜어주거나, 음성인식시스템의 인식성능을 향상시키기 위해 전처리 과정 등에서 사용되고 있는 기술로서 꾸준히 연구되고 있는 분야이다. 음성개선 방법으로는 크게 스펙트럽 차감법, MMSE-STSA 등과 같이 단일 채널 음성신호를 이용하는 방법[1]과 GSC(Generalized Sidelobe Canceller), DSB(Delay-Sum Beamforming) 등과 같이 마이크로폰 배열 기반의 다채널 음성 신호를 이용하는 방법[2]으로 나눌 수 있다.
IVA를 실시간으로 동작하는 마이크로폰 배열에 적용하기 위해서는 어떤 과정이 수행되는가? IVA를 실시간으로 동작하는 마이크로폰 배열에 적용하기 위해서 다음의 2가지 과정이 수행된다. 첫째는, 다채널 입력 잡음음성으로부터 음원이 분리된 출력신호를 얻기 위한 IVA 과정에서 분리행렬(unmixing matrix)을 구해야 하는데, 이 과정은 음성의 시작부분에서 1~2초 구간의 음성을 이용하여 수행하게 되며 그림 2에서 훈련/분리 과정으로 표시되어 있다. 이 구간에서는 DSB의 출력신호가 시스템의 출력신호가 된다. 둘째는, 구해진 분리행렬을 이용하여 IVA를 수행하면 다채널의 출력신호를 얻게 되는데, 잡음이 제거된 음성신호 이외에는 모두 잡음성분에 해당되므로 주요 신호 2개를 추출하여 DSB 출력신호와 IVA 출력신호와의 상관계수를 구하여 상관도가 높은 신호를 시스템의 출력신호로 한다. IVA에서 분리행렬을 구하는 과정과 이를 이용하여 출력신호를 얻는 독립성분분석 알고리즘의 자세한 과정은 [6]에 주어져 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (9)

  1. Ephraim, Y. & Malah, D. (1984). Speech enhancement using a minimum-mean square error short-time spectral amplitude estimator, Acoustics, Speech and Signal Processing, IEEE Transactions on. vol. 32, 1109-1121. 

  2. Benesty, J. et al. (2008). Microphone array signal processing. Berlin: Springer Verlag. 

  3. Hyvarinen, A., Karhunen, J. & Oja, E. (2001). Independent component analysis. New Youk: Wiley. 

  4. Haykin, S. (2009). Neural networks and learning machines. New Jersey: Pearson Prentice Hall. 

  5. Asano, F., Ikeda, S., Ogawa, M., Asoh, H. & Kitawaki, N. (2001). A combined approach of array processing and independent component analysis for blind separation of acoustic signals, in Proc.IEEE Int. Conf. Acoust., Speech Signal Process., 2729-2732. 

  6. Kim, T., Attias, H., Lee, S. & Lee, T. (2007). Blind source separation exploiting higher-order frequency dependencies, Audio, Speech, and Language Processing, IEEE Transactions on, vol. 15, 70-79. 

  7. PESQ, http://www.itu.int/rec/T-REC-P.862/en 

  8. Donohue, K. D. Systems Array Processing Toolbox. http://www.engr.uky.edu/-donohue/. 

  9. NoiseX-92, http://www.speech.cs.cmu.edu/comp.speech/ Section1/ Data/noisex.html 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로