$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 개량된 음성매개변수를 사용한 지속시간이 짧은 잡음음성 중의 배경잡음 분류
Background Noise Classification in Noisy Speech of Short Time Duration Using Improved Speech Parameter 원문보기

한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, v.20 no.9, 2016년, pp.1673 - 1678  

최재승 (Department of Electronic Engineering, Silla University)

초록
AI-Helper 아이콘AI-Helper

음성인식처리 분야에서 배경잡음으로 인하여 음성입력이 배경잡음으로 잘못 판단되는 원인이 되어 음성인식율의 저하를 초래한다. 이러한 종류의 잡음대책은 단순하지 않으므로 보다 고도한 잡음처리기술이 필요하게 된다. 따라서 본 논문에서는 잡음환경 중에서 정상적인 배경잡음 혹은 비정상적인 배경잡음과 지속 시간이 짧은 음성을 구별하는 알고리즘에 대하여 기술한다. 본 알고리즘은 다른 종류의 잡음과 음성을 구별하는 중요한 수단으로서 개량된 음성의 특징파리미터를 사용한다. 다음으로 다층퍼셉트론 네트워크에 의하여 잡음의 종류를 추정하는 알고리즘에 대해서 기술한다. 본 실험에서는 잡음과 음성이 구별이 가능하도록 실험적으로 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

In the area of the speech recognition processing, background noises are caused the incorrect response to the speech input, therefore the speech recognition rates are decreased by the background noises. Accordingly, a more high level noise processing techniques are required since these kinds of noise...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 실제 환경에서 음성을 방해하는 배경잡음은 백색잡음과 같은 정상적인 잡음과 도로잡음과 같은 비정상적인 잡음의 합으로 표현하는 경우가 많다. 따라서 본 논문에서는 음성 중에서 정상적인 잡음과 비정상적인 잡음을 구별하기 위하여, 잡음이 섞인 음성 중에서 지속 시간이 짧은 음성을 대상으로 하여 배경잡음을 구별하는 알고리즘에 대하여 기술한다.
  • 또한 본 알고리즘은 잡음과 음성을 구별하는 중요한 수단으로서 개량된 음성의 특징파리미터를 사용하여 다층퍼셉트론 네트워크에 의하여 잡음의 종류를 추정하는 알고리즘에 대해서 기술한다. 본 실험에서는 여러 종류의 잡음을 이용하여 음성 중에서 잡음을 구별하는 실험을 실시한다.
  • 음성인식에 유효한 음향 특징량으로서 음성의 스펙트럼 이외에 전력 및 동적 특징량이 있으며, 이러한 파라미터를 조합하는 것에 의하여 음성인식 성능이 향상되는 것이 보고되고 있다[7]. 본 논문에서는 개량된 선형예측계수(Linear Predictive Coefficient, LPC)[9]의 음향 특징량으로 사용하여 다층 퍼셉트론 네트워크에 부가는 방법을 제안한다.
  • 본 실험에서는 3층 구조의 퍼셉트론형의 신경회로망에 선형예측계수 LPC[9]를 입력으로 하여 각 프레임에서 잡음 및 음성을 분류하는 것을 목적으로 하여 분류율을 높이는 실험에 대하여 기술한다.
  • 음성인식처리의 분야에서 배경잡음은 음성인식율의 저하를 초래하고 있으므로 보다 고도한 잡음처리기술이 필요하게 된다. 따라서 본 논문에서는 잡음환경 중의 계속시간이 짧은 정상적인 배경잡음 및 비정상적인 배경잡음을 인간의 음성과 구별하는 알고리즘에 대하여 기술하였다. 본 알고리즘은 잡음과 음성을 구별하는 중요한 수단으로서, 음성의 특징파리미터를 선택하여 다층 퍼셉트론 네트워크에 의하여 잡음의 종류를 구별하는 알고리즘이다.
  • 본 실험에서는 잡음과 음성의 구별이 가능하도록 실험적으로 분명하게 하였다. 따라서 중간층 1층으로 구성된 3층 퍼셉트론을 사용한 역전파 학습 알고리즘에 의하여 학습시킨 결과, 양호한 음성인식 결과가 학습 이외의 데이터에 대해서도 실험적으로 확인할 수 있었다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
음성 및 잡음을 구별하는 연구로 최근에 제안되는 것들의 한계점은 무엇인가? 이러한 음성 및 잡음을 구별하는 수단으로서 스펙트럼의 차이를 이용하는 연구, 켑스트럼 계수의 분포를 이용하는 연구, 스펙트럼의 양자화를 이용하는 연구, 위너필터를 이용하는 연구, 신경회로망을 이용하여 판별하는 연구 들이 제안되고 있다[6-8]. 그러나 이러한 연구들은 주로 정상적인 잡음을 대상으로 하고 있으며, 또한 잡음 종류가 단순하므로 다양한 잡음 하에서 음성과 잡음을 구별하는 실험으로는 만족하지 못하고 있다. 또한 이러한 연구들은 연속한 음성에 잡음이 중첩된 경우를 대상으로 하고 있어서 음성단어 인식장치가 오동작하는 연속시간이 짧은 잡음을 대상으로 하고 있지 않다.
잡음이 음성인식 장치의 오작동과 음성인식률 저하의 주 원인이 되는 이유는? 이러한 잡음에는 정상적인 배경잡음 외에 비정상적인 잡음이 일반적으로 존재한다. 이러한 비정상적인 잡음 중에는 피치 주파수 및 스펙트럼의 형태가 음성의 주파수 및 스펙트럼과 상당히 유사한 잡음들이 존재하여, 음성인식 장치의 오작동 및 음성인식률 저하의 주요 원인이 되고 있다[1-3].
실제 환경에서 음성을 방해하는 배경잡음은 어떻게 표현하는 경우가 많은가? 실제 환경에서 음성을 방해하는 배경잡음은 백색잡음과 같은 정상적인 잡음과 도로잡음과 같은 비정상적인 잡음의 합으로 표현하는 경우가 많다. 따라서 본 논문에서는 음성 중에서 정상적인 잡음과 비정상적인 잡음을 구별하기 위하여, 잡음이 섞인 음성 중에서 지속 시간이 짧은 음성을 대상으로 하여 배경잡음을 구별하는 알고리즘에 대하여 기술한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (12)

  1. C. Hanilci, T. Kinnunen, R. Saeidi, J. Pohjalainen, P. Alku, F. Ertas, J. Sandberg, and M. Hansson-Sandsten, "Comparing spectrum estimators in speaker verification under additive noise degradation," IEEE International Conference on Acoustics, Speech and Signal Processing, pp. 4769-4772, March 2012. 

  2. R. Saeidi, J. Pohjalainen, T. Kinnunen, and Paavo Alku, "Temporally Weighted Linear Prediction Features for Tackling Additive Noise in Speaker Verification," IEEE Signal Processing Letters, vol. 17, no. 6, pp. 599-602, June 2010. 

  3. R. Su, X. Liu, and L. Wang, "Automatic Complexity Control of Generalized Variable Parameter HMMs for Noise Robust Speech Recognition," IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 23, no. 1, pp. 102-114, Jan. 2015. 

  4. J. S. Choi, "Speech and Noise Recognition System by Neural Network," The Korea Institute of Electronic Communication Sciences, vol. 5, no. 4, pp. 357-362, Aug. 2010. 

  5. N. Moritz, Jorn Anemuller, and B. Kollmeier, "An Auditory Inspired Amplitude Modulation Filter Bank for Robust Feature Extraction in Automatic Speech Recognition," IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 23, no. 11, pp. 1926-1937, Nov. 2015. 

  6. J. S. Choi, "Noise Reduction Algorithm in Speech by Wiener Filter," The Korea Institute of Electronic Communication Sciences, vol. 8, no. 8, pp. 1293-1298, Aug. 2013. 

  7. S. Furui, "Speaker-Independent Isolasted Word Recognition Using Dynamic Features of Speech Spectrum," IEEE Transactions on Acoustics, Speech, and Signal Processing, vol. 34, no. 1, pp. 52-59, Feb. 1986. 

  8. J. S. Choi, "A Wiener Filter Algorithm of Noise Subtraction Based on Threshold Detection," Korean Institute of Information Technology, vol. 13, no. 7, pp. 51-56, July 2015. 

  9. X. Zhang, Y. Guo, Xuemei Hou, "A speech Recognition Method of Isolated Words Based on Modified LPC Cepstrum," IEEE International Conference on Granular Computing, pp. 481-484, Nov. 2007. 

  10. S. K. Pal, S. Mitra, "Multilayer perceptron, fuzzy sets, and classification," IEEE Transaction on Neural Networks, vol. 3, no. 5, pp. 683-697, Sep. 1992. 

  11. D. Rumelhart, G. Hinton and R. Williams, "Learning representations by back-propagation errors," Nature, vol. 323, pp. 533-536, Oct. 1986. 

  12. H. Hirsch and D. Pearce, "The AURORA experimental framework for the performance evaluations of speech recognition systems under noisy conditions," in Proc. ISCA ITRW ASR2000 on Automatic Speech Recognition: Challenges for the Next Millennium, Paris, France, Oct. 2000. 

저자의 다른 논문 :

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로