$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

켑스트럼으로부터 변환된 로그 스펙트럼을 이용한 포먼트 평활화 켑스트럴 평균 차감법
Formant-broadened CMS Using the Log-spectrum Transformed from the Cepstrum 원문보기

한국음향학회지= The journal of the acoustical society of Korea, v.21 no.4, 2002년, pp.361 - 373  

김유진 (인하대학교 전자공학과 디지털 신호처리 연구실) ,  정혜경 (국방과학연구소 4체계 개발본부 전자전체계부 2팀인하대학교 전자공학과 디지털 신호처리 연구실) ,  정재호 (인하대학교 전자공학과 디지털 신호처리 연구실)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 음성 인식과 화자 인식에서 채널 변이 정규화를 위해 널리 사용되는 전통적인 켑스트럴 평균차감법 (CMS: Cepstral Mean Subtraction)의 성능을 향상시키기 위한 정규화 방법을 제안한다. 기존의 켑스트럴 평균 차감법은 장구간 켑스트럼의 평균으로 채널 성분을 추정하므로 유성음의 포먼트에 의해 채널 성분이 편향되는 단점을 가진다. 제안된 포먼트 평활화 켑스트럴 평균 차감법 (FBCMS; Formant-broadened CMS)은 켑스트럼으로부터 변환된 로그 스펙트럼에서 포먼트 위치를 쉽게 찾을 수 있고, 포먼트는 전극점 모델로 표현되는 성도 전달 함수의 우세 극점에 대응된다는 사실에 근거한다. 따라서 제안된 방법은 켑스트럼으로부터 음성의 포먼트를 구하고, 이로부터 포먼트의 대역폭을 확장한 켑스트럼을 구한 후 평균함으로써 채널 켑스트럼 성분으로부터 우세 극점들의 영향을 제거한다. 전극점 모델의 우세 극점을 얻기 위해 다항식 인수분해 과정을 거치지 않으므로 연산량을 줄일 수 있으며 포먼트에 해당하는 우세 극점만으로 선택적으로 처리할 수 있다. 본 연구에서는 4가지의 모의 채널을 이용하여 전통적인 켑스트럴 평균 차감법, 극점 필터화 켑스트럴 평균 차감법 (Pole-filtered CMS) 그리고 제안된 방법의 비교실험을 수행하였다. 실제 채널 켑스트럼과 추정된 채널 켑스트럼과의 거리를 측정하는 실험에서 음성에 의한 편향을 완화시켜 실제 채널에 보다 가까운 평균 켑스트럼을 얻을 수 있음을 확인하였다. 또한 문장독립 화자 식별에서 제안된 방법은 전통적인 켑스트럴 평균 차감법보다 우세하고 극점 필터화 켑스트럴 평균 차감법 (Pole-filtered CU)과는 비슷한 결과를 보였다. 결과적으로 제안된 방법은 전통적인 켑스트럴 평균 차감법에 기반하여 효과적인 채널 정규화가 가능하다는 것을 보였다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose a channel normalization method to improve the performance of CMS (cepstral mean subtraction) which is widely adopted to normalize a channel variation for speech and speaker recognition. CMS which estimates the channel effects by averaging long-term cepstrum has a weak point...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 두 번째 실험은 첫 번째 실험에서 사용한 4개의 채널을 통과시킨 채널 불일치 음성을 이용한 폐쇄집단 문장독립 화자식별을통해 실제 불일치 조건에서의 성능을 비교하기 위해 수행되었다. 인식기로는 Naik의 방법과 동일하게 46개의 혼합 (mixture)으로 구성된 가우시안 혼합 모델 (GMM: Gaussian Mixture Model) 알고리즘을 사용하였고 음성 특징으로는 12차의 LPCC만을 사용하였다.
  • 본 논문에서는 음성인식이나 화자인식에서의 채널 불일치에 의한 성능저하를 최소화하기 위하여 CMS를 기반으로 효과적으로 채널성분을 추정하고 제거할 수 있는 채널 정규화방법을 제안하였다. 제안된 FBCMS 방법은 선형 예측 다항식의 우세 극점에 해당하는 근을구하기 위해 켑스트럼으로부터 변환된 로그 스펙트럼에서의 포먼트를 찾고 대역폭을 확장한 켑스트럼을 얻는 과정으로 이루어진다.
  • 본 논문에서는 채널정규화를 위해 널리 사용되는 CMS의 성능을 향상시키기 위해 PFCMS에서 제안된 극점 필터링의 결과를 얻을수 있고 연산량관점에서 좀더 효과적인 포먼트 대역확장 CMS (FBCMS; formant-broadened CMS)에 대해서 설명한다.
  • 본 실험은 채널 통과 음성의 켑스트럼으로부터 추정된 채널 성분이 실제 채널과 얼마나 가까운지를 알아보기 위해 수행되었다. 켑스트럴 거리는 각 채널에 대하여 실제 채널의 켑스트럼, cch,과 추정된 채널의 켑스트럼, 즉 채널 통과 음성의 켑스트럼 평균, # 사이의 거리로서 다음과 같은 식 (13)에 의해서 정의된다.
본문요약 정보가 도움이 되었나요?

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로