$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

GSC 기반 빔포밍을 위한 주파수 밴드별 전력비 분포의 혼합 가우시안 모델을 이용한 목표 음성신호의 검출

Target Speech Detection Using Gaussian Mixture Model of Frequency Bandwise Power Ratio for GSC-Based Beamforming

한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.19 no.1, 2015년, pp.61 - 68  

장형욱 (Department of Electronics Engineering, Gyeongsang National University) ,  김영일 (Department of Electronics Engineering, Gyeongsang National University) ,  정상배 (Department of Electronics Engineering, Gyeongsang National University)

초록
AI-Helper 아이콘AI-Helper

다양한 종류의 잡음에 의해서 발생하는 음성인식 성능 저하를 보상하기 위해서는 잡음제거가 필수적이다. 마이크로폰 배열을 이용하는 많은 잡음제거 기술 중에서, GSC는 비정상성 잡음을 제거하기 위해서 널리 적용되어 왔다. GSC의 성능은 AMC에 의해서 직접적인 영향을 받는다. 즉, 정확한 목표 음성 신호의 검출은 순수 잡음구간에서의 충분한 잡음제거 및 목표 음성구간에서의 적은 왜곡을 보장하기 위해서 필수적이다. 따라서, 본 논문에서는 고정 빔포밍의 출력과 차단 매트릭스의 출력간의 전력비가 주파수 밴드 단위로 계산되는 향상된 AMC 설계법을 제안한다. 그 후, 밴드별 전력비는 가우시안 혼합에 의해서 각 클래스가 확률적으로 모델링 된다. 실험결과, 제안한 알고리즘ROC 및 출력 SNR 관점에서 더 높은 성능을 보였다.

Abstract AI-Helper 아이콘AI-Helper

Noise reduction is necessary to compensate for the degradation of recognition performance by various types of noises. Among many noise reduction techniques using microphone array, generalized sidelobe canceller (GSC) has been widely applied to reduce nonstationary noises. The performance of GSC is d...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 GSC 기반 빔포밍의 AMC를 위한 주파수 밴드별 전력비 분포의 혼합 가우시안 모델을 이용한 목표 신호 검출 기법을 제안하였다. 실험결과 제안한 방법에 의한 목표 신호의 검출 성능은 EER 관점에서 0.
  • 본 논문에서는 정확한 목표신호 구간 검출을 위해서 주파수 밴드 단위에서의 fixed beamforming(FBF) 출력과 blockimg matrix(BM) 출력간의 전력비를 추정하여 AMC를 설계하는 방식을 제안한다. 본 논문의 구성은 다음과 같다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
정상성 잡음과 비정상성 잡음을 제거하는 방법은 무엇이 있는가? 정상성 잡음으로 PC의 팬 소리, 자동차 엔진 소리 등이 있으며, 비정상성 잡음으로는 사람의 목소리, 음악소리 등이 있다. 정상성 잡음을 제거하는 방법으로 단일 채널을 이용한 Wiener나 Kalman 필터링과 같은 적응 필터링이 있고[1,2], 비정상성 잡음은 마이크로폰 배열을 이용하여 제거하며 목표 음원에 대한 정보가 필요 없는 blind source separation (BSS) 기술과 목표 신호의 위치정보가 필요한 빔포밍 기술이 연구되어왔다[3].
정상성 잡음에는 어떠한 소리가 포함되는가? 잡음의 종류로는 정상성 잡음과 비정상성 잡음이 있다. 정상성 잡음으로 PC의 팬 소리, 자동차 엔진 소리 등이 있으며, 비정상성 잡음으로는 사람의 목소리, 음악소리 등이 있다. 정상성 잡음을 제거하는 방법으로 단일 채널을 이용한 Wiener나 Kalman 필터링과 같은 적응 필터링이 있고[1,2], 비정상성 잡음은 마이크로폰 배열을 이용하여 제거하며 목표 음원에 대한 정보가 필요 없는 blind source separation (BSS) 기술과 목표 신호의 위치정보가 필요한 빔포밍 기술이 연구되어왔다[3].
LCMV 기반의 빔포밍 알고리즘의 특징은 무엇인가? 대표적인 다채널기반 빔포밍 알고리즘으로는 linearly constrained minimum variance (LCMV)와 일반화된 부극제거기(generalized sidelobe canceller (GSC)) 알고리즘이 있다[4,5]. LCMV 기반의 빔포밍 알고리즘은 목표 음원 방향의 신호 왜곡이 없는 조건에서 출력 에너지를 최소화시킨다. 이러한 조건 때문에 적응 필터의 수렴이 늦어짐으로 의한 충분한 잡음제거가 이루어지지 않는 단점이 있다[4].
질의응답 정보가 도움이 되었나요?

참고문헌 (10)

  1. ETSI ES 202 212, Speech processing, transmission and quality aspects (STQ), v.1.1.2, 2005. 

  2. S. Jeong and M. Hahn, "Speech quality and recognition rate improvement in car noise environments," Electronics Letters, Vol.37, No.12, pp. 801-802, 2001. 

  3. A. Hyvarinen and E. Oja, "Independent component analysis: Algorithms and applications," Neural Networks, vol. 13, no. 4, pp. 411-430, 2000. 

  4. O. Frost, "An algorithm for linearly constrained adaptive array processing," Proceedings of the IEEE, Vol 60, No. 8, pp. 926-935, 1972. 

  5. S. Gannot et al., "Signal enhancement using beamforming and nonstationarity with applications to speech," IEEE Trans. Signal Process., Vol. 49, No. 8, pp. 1614-1626, 2001. 

  6. Y. Jung, H. Kang, C. Lee, D. Youn, C. Choi, and J. Kim, "Adaptive microphone array system with two-stage adaptation mode controller," IEICE Trans. Fund., vol. E88-A, no. 4, pp. 972-977, Apr. 2005. 

  7. O. Hoshuyama, A. Sugiyama, and A. Hirano, "A robust adaptive beamformer for microphone arrays with a blocking matrix using constrained adaptive filters," IEEE Trans. Signal Process., Vol 47, No. 10, pp. 2677-2684, 1999. 

  8. L. Rabiner and B. Juang, Fundamentals of Speech Recognitions, Prentice Hall, 1993. 

  9. M. Hayes, Statistical Digital Signal Processing and Modeling, John Wiley & Sons, 1996. 

  10. F. Tom, "An introduction to ROC analysis", Pattern Recognition Letters, Vol. 27, pp. 861-874. 2006. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트