[논문]잡음음성인식을 위한 데이터 기반의 Jacobian 적응방식

정용주

doi:10.7776/ask.2006.25.4.159

문제 정의

본 논문에서는 보다 향상된 JA을 위해서 기준 HMM을 잡음음성으로 직접 훈련하는 방안을 제안하였다. 모델결합방식에 비해서 제안된 방식은 보다 강인한 기준HMM을 구성할 수 있었으며, 기존의 JA 방식뿐만 아니라 기타의 모델 보상방식에 비해서도 우수한 인식성능을 보임을 알 수 있었다.
기존의 연구에서[7], 우리는 잡음음성인식에서 HMM 파라미터의 보상을 위하여 해석적인 방법보다는 직접데이터 기반의 추정방식을 사용하는 경우 성능의 향상을 이룰 수 있음을 보였다. 이와 동일한 생각에 기초하여, 본 논문에서는 Jacobian 행렬들을 Baum-Welch 알고리듬[8]에 기반하여 얻고자 한다.
이와 동일한 생각에 기초하여, 본 논문에서는 Jacobian 행렬들을 Baum-Welch 알고리듬⑻에 기반하여 얻고자 한다.

제안 방법

계산을 위해서는, 먼저 훈련과정에서 미리 가정된 기준잡음신호 (reference noise signal)에 대해서 평균값 瓦 ”}을 구하고 이를 식⑷의 » 대신에 대입하여 기준잡음신호의 평균에 해당하는 선형스펙트럼 M을 구한다.
기준 HMM을 모델결합방식을 이용하여 얻는 대신에 본 논문에서는 잡음음성을 이용하여 직접 훈련하는 방안을 제안하였다. 이 경우에는 음성신호와 기준HMM의 혼합성분과의 정렬관계가 불명확해지므로 (모델결합방식에서는 음성신호와 기준 HMM의 혼합성분과의 정렬관계는 기존의 깨끗한 음성 HMM과의 정렬관계를 유지함) 식 (3)~(5)을 이용하여 Jacobian 행렬을 구하기가 어려워진다.
이것은 JA 방식이 기존의 PMC 나 NOVO에 비해서 그리 높은 성능을 보이지 못하는 주요 이유가 된다고 생각된다. 본 논문에서는JA 방식의 성능을 향상시키기 위한 방안으로 기준 HMM을 잡음 음성을 이용해서 직접 훈련하는 것을 제안하였는데, 이 경우에는 Jacobian 행렬과 깨끗한 음성 HMM 파라미터 간의 관계가 불명료해지므로, Jacobian 행렬을 훈련과정에서 Baum-Welch 방식을 이용하여 추정하였다. 본 논문의 구성은 다음과 같다.
본 논문에서는JA 방식의 성능을 향상시키기 위한 방안으로 기준 印皿을 잡음음성을 이용해서 직접 훈련하는 것을 제안하였는데, 이경우에는 Jacobian 행렬과 깨끗한 음성 HMM 파라미터간의 관계가 불명료해지므로, Jacobian 행렬을 훈련과정에서 Baum-Welch 방식을 이용하여 추정하였다.
최근까지 잡음음성인식에서 보다 성능을 높이기 위한 다양한 방법들이 제안되고 개발되었다. 이러한 연구결과는 대체적으로 몇 가지 부류로 구분 지을 수 있는데, 음질향상기법, 잡음에 강인한 특징추출기법 그리고 인식모델 보상방법들로 나누어 질 수 있을 것이다. Hidden Markov model (HMM) 에 기반한 인식모델 보상방식에서는 잡음음성으로부터 추출한 잡음의 통계정보를 이용하여 HMM 파라미터 값에 대한 보상이 이루어진다[1-2-3-4], 특히, JA 방식은 실제 환경과 비슷한 조건에서 HMM을 미리 훈련한 경우에 매우 효과적인 것으로 알려져 있으며 미리 훈련된 HMM (기준 HMM)의 파라미터 값들은 Jacobian 행렬을 이용하여 실제 환경의 잡음 음성에 용이하게 적응된다[4].
하지만 많은 종류의 기준 HMM을 인식시에 가지고 있어야 하는 것이 실제적으로 어렵기 때문에 우리는 제안된 방식의 강인성을 검토비교 하였다. 이를 위해서는 특정한 SNR 조건하에서 훈련된 기준 HMM을 이용하여 다양한 SNR을 가진 인식환경에서 실험하였다. 표3에는 기준HMM이 각각 10 dB과 20 dB의 배블 잡음 환경에서 훈련된 경우에 인식성능을 보여준다.
하지만 많은 종류의 기준 HMM을 인식시에 가지고 있어야 하는 것이 실제적으로 어렵기 때문에 우리는 제안된 방식의 강인성을 검토비교 하였다. 이를 위해서는 특정한 SNR 조건하에서 훈련된 기준 HMM을 이용하여 다양한 SNR을 가진 인식환경에서 실험하였다. 표3에는 기준HMM이 각각 10 dB과 20 dB의 배블 잡음 환경에서 훈련된 경우에 인식성능을 보여준다.
전체 화자를 20명씩 4개의 그룹으로 나눈 후, 그 중 하나의 그룹은 인식용으로 나머지 3그룹은 훈련용으로 활용하였다. 이와 같은 과정을 4회 반복하여 인식실험을 수행하여 인식화자의 수를 4배로 증가시키는 효과를 거두도록 하였다. 잡음음성을 얻기 위해서는 원래의 깨끗한 음성에 차량잡음과 배블(babble)잡음을 다양한 신호대잡음비에 맞추어 더해 주었다.
전체 화자를 20명씩 4개의 그룹으로 나눈 후, 그 중 하나의 그룹은 인식용으로 나머지 3그룹은 훈련용으로 활용하였다. 이와 같은 과정을 4회 반복하여 인식실험을 수행하여 인식화자의 수를 4배로 증가시키는 효과를 거두도록 하였다. 잡음음성을 얻기 위해서는 원래의 깨끗한 음성에 차량잡음과 배블(babble)잡음을 다양한 신호대잡음비에 맞추어 더해 주었다.
인식특징벡터로는 13차의 멜주파 (mel-frequency) 켑스트럼 계수 (MFCC)와 그의 차분계수 (delta-MFCC)를 사용하였다.
이와 같은 과정을 4회 반복하여 인식실험을 수행하여 인식화자의 수를 4배로 증가시키는 효과를 거두도록 하였다. 잡음음성을 얻기 위해서는 원래의 깨끗한 음성에 차량잡음과 배블(babble)잡음을 다양한 신호대잡음비에 맞추어 더해 주었다. 잡음신호는 AURORA 2 데이터에 있는 잡음파일로부터 얻었다.
이와 같은 과정을 4회 반복하여 인식실험을 수행하여 인식화자의 수를 4배로 증가시키는 효과를 거두도록 하였다. 잡음음성을 얻기 위해서는 원래의 깨끗한 음성에 차량잡음과 배블(babble)잡음을 다양한 신호대잡음비에 맞추어 더해 주었다. 잡음신호는 AURORA 2 데이터에 있는 잡음파일로부터 얻었다.
잡음환경에서 화자독립 단어 인식실험을 통해서 제안된 방식의 성능을 평가하였다. 인식대상 어휘는 음소분포가 비교적 고르게 되어 있는 한국어 75 단어이며 음향 모델을 위한 기본단위는 32개의 유사음소를 사용하였다.
인식실험을 위해서 잭-나이프 (Jack-knife) 방식을 이용하였다. 전체 화자를 20명씩 4개의 그룹으로 나눈 후, 그 중 하나의 그룹은 인식용으로 나머지 3그룹은 훈련용으로 활용하였다. 이와 같은 과정을 4회 반복하여 인식실험을 수행하여 인식화자의 수를 4배로 증가시키는 효과를 거두도록 하였다.
표1과 2에서의 우수한 성능을 얻기 위해서는 각각의 SNR에 대해서 독자적인 기준 HMM을 가지고 있어야 한다. 하지만 많은 종류의 기준 HMM을 인식시에 가지고 있어야 하는 것이 실제적으로 어렵기 때문에 우리는 제안된 방식의 강인성을 검토비교 하였다. 이를 위해서는 특정한 SNR 조건하에서 훈련된 기준 HMM을 이용하여 다양한 SNR을 가진 인식환경에서 실험하였다.
표1과 2에서의 우수한 성능을 얻기 위해서는 각각의 SNR에 대해서 독자적인 기준 HMM을 가지고 있어야 한다. 하지만 많은 종류의 기준 HMM을 인식시에 가지고 있어야 하는 것이 실제적으로 어렵기 때문에 우리는 제안된 방식의 강인성을 검토비교 하였다. 이를 위해서는 특정한 SNR 조건하에서 훈련된 기준 HMM을 이용하여 다양한 SNR을 가진 인식환경에서 실험하였다.

대상 데이터

잡음환경에서 화자독립 단어 인식실험을 통해서 제안된 방식의 성능을 평가하였다. 인식대상 어휘는 음소분포가 비교적 고르게 되어 있는 한국어 75 단어이며 음향 모델을 위한 기본단위는 32개의 유사음소를 사용하였다. 각각의 유사음소단위는 연속밀도 HMM에 의해서 모델링 된다.
잡음환경에서 화자독립 단어 인식실험을 통해서 제안된 방식의 성능을 평가하였다. 인식대상 어휘는 음소분포가 비교적 고르게 되어 있는 한국어 75 단어이며 음향 모델을 위한 기본단위는 32개의 유사음소를 사용하였다. 각각의 유사음소단위는 연속밀도 HMM에 의해서 모델링 된다.

이론/모형

인식실험을 위해서 잭-나이프 (Jack-knife) 방식을 이용하였다.
인식실험을 위해서 잭-나이프 (Jack life) 방식을 이용하였다.
잡음신호는 AURORA 2 데이터에 있는 잡음파일로부터 얻었다. 인식특징벡터로는 13차의 멜주파 (mel-frequency) 켑스트럼 계수 (MFCC)와 그의 차분계수 (delta-MFCC)를 사용하였다. 표1과 2에는 제안된 방식, 즉 데이터기반의 JA (D-JA)에 대한 인식결과가 나타나있다.

성능/효과

표3에는 기준HMM이 각각 10 dB과 20 dB의 배블 잡음 환경에서 훈련된 경우에 인식성능을 보여준다. 기대한 데로 D-JA 방식은 기존의 방식에 비해서 우수한 강인성을 보여 주었다. 예를 들어 기준HMM이 10 dB에서 훈련된 경우에 D-JA 방식은 0 dB에서 79.
1(%)의 인식성능을 보임을 알 수 있다. 또한 20 dB에서 기준 HMM을 훈련한 경우 D-JA 방식은 PMC 나 재훈련의 경우에 비해서도 향상된 성능을 보임을 알 수 있었다. 기존의 JA 방식은 인식환경이 높은 SN^ 인 경우에는 다소 좋은 성능을 보이기도 하지만 전반적으로 제안된 방식에 비해서는 다양한 SNR 에 대한 강인성이 저조 한 것으로 보여 진다.
1(%)의 인식성능을 보임을 알 수 있다. 또한 20 dB에서 기준 HMM을 훈련한 경우 D-JA 방식은 PMC 나 재훈련의 경우에 비해서도 향상된 성능을 보임을 알 수 있었다. 기존의 JA 방식은 인식환경이 높은 SN^ 인 경우에는 다소 좋은 성능을 보이기도 하지만 전반적으로 제안된 방식에 비해서는 다양한 SNR 에 대한 강인성이 저조 한 것으로 보여 진다.
본 논문에서는 보다 향상된 JA을 위해서 기준 HMM을 잡음음성으로 직접 훈련하는 방안을 제안하였다. 모델결합방식에 비해서 제안된 방식은 보다 강인한 기준HMM을 구성할 수 있었으며, 기존의 JA 방식뿐만 아니라 기타의 모델 보상방식에 비해서도 우수한 인식성능을 보임을 알 수 있었다. 제안된 방식의 강인성은 특히 소수의 기준HMM 만이 사용가능한 실제 인식 환경에서 매우 유용할 것으로 생각된다.
본 논문에서는 보다 향상된 JA을 위해서 기준 HMM을 잡음음성으로 직접 훈련하는 방안을 제안하였다. 모델결합방식에 비해서 제안된 방식은 보다 강인한 기준HMM을 구성할 수 있었으며, 기존의 JA 방식뿐만 아니라 기타의 모델 보상방식에 비해서도 우수한 인식성능을 보임을 알 수 있었다. 제안된 방식의 강인성은 특히 소수의 기준HMM 만이 사용가능한 실제 인식 환경에서 매우 유용할 것으로 생각된다.
제안된 D-JA 방법은 PMC 나 JA 방식에 비해서 모든 신호대잡음비 (SNR: Signal to noise ratio)에서 향상된 인식성능을 보임을 알 수 있었다. 이는 기준 HMM을 잡음음성을 이용하여 직접적으로 훈련한데 그 주요 원인이 있다고 생각된다.
제안된 D-JA 방법은 PMC 나 JA 방식에 비해서 모든 신호대잡음비 (SNR: Signal to noise ratio)에서 향상된 인식성능을 보임을 알 수 있었다. 이는 기준 HMM을 잡음음성을 이용하여 직접적으로 훈련한데 그 주요 원인이 있다고 생각된다.
이는 기준 HMM을 잡음음성을 이용하여 직접적으로 훈련한데 그 주요 원인이 있다고 생각된다. 제안된 D-JA 방식은 PMC 나 JA 방식에 비해서 인식에러의 상대적인 감소율이 잡음음성인 식에서 약 40~50(%) 에 이르는 우수한 성능을 보였다.
이는 기준 HMM을 잡음음성을 이용하여 직접적으로 훈련한데 그 주요 원인이 있다고 생각된다. 제안된 D-JA 방식은 PMC 나 JA 방식에 비해서 인식에러의 상대적인 감소율이 잡음음성인 식에서 약 40~50(%) 에 이르는 우수한 성능을 보였다.
표에 나타난 인식율은 MFCC의 정적 평균벡터만을 보상한 경우에 해당한다. 표의 결과에서 보면 PMC와 JA 방식은 큰 성능의 차이를 보이지 않음을 볼 수 있다. PMC 과정에서 잡음통계정보를 추정하기 위한 묵음구간을 음성의 앞부분의 20프레임 (0.

후속연구

기존의 JA 방식은 인식환경이 높은 SN^ 인 경우에는 다소 좋은 성능을 보이기도 하지만 전반적으로 제안된 방식에 비해서는 다양한 SNR 에 대한 강인성이 저조 한 것으로 보여 진다. 이와 같은 D-JA 방식의 다양한 SNR에 대한 강인성은 소수의 기준 HMM만을 제공할 수 있는 실제 환경에서 매우 효과적일 것이라고 생각된다.
기존의 JA 방식은 인식환경이 높은 SN^ 인 경우에는 다소 좋은 성능을 보이기도 하지만 전반적으로 제안된 방식에 비해서는 다양한 SNR 에 대한 강인성이 저조 한 것으로 보여 진다. 이와 같은 D-JA 방식의 다양한 SNR에 대한 강인성은 소수의 기준 HMM만을 제공할 수 있는 실제 환경에서 매우 효과적일 것이라고 생각된다.
모델결합방식에 비해서 제안된 방식은 보다 강인한 기준HMM을 구성할 수 있었으며, 기존의 JA 방식뿐만 아니라 기타의 모델 보상방식에 비해서도 우수한 인식성능을 보임을 알 수 있었다. 제안된 방식의 강인성은 특히 소수의 기준HMM 만이 사용가능한 실제 인식 환경에서 매우 유용할 것으로 생각된다.
모델결합방식에 비해서 제안된 방식은 보다 강인한 기준HMM을 구성할 수 있었으며, 기존의 JA 방식뿐만 아니라 기타의 모델 보상방식에 비해서도 우수한 인식성능을 보임을 알 수 있었다. 제안된 방식의 강인성은 특히 소수의 기준HMM 만이 사용가능한 실제 인식 환경에서 매우 유용할 것으로 생각된다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

잡음음성인식을 위한 데이터 기반의 Jacobian 적응방식
A Data-Driven Jacobian Adaptation Method for the Noisy Speech Recognition 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

참고문헌 (8)

이 논문을 인용한 문헌

저자의 다른 논문 :

연구과제 타임라인

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

잡음음성인식을 위한 데이터 기반의 Jacobian 적응방식 A Data-Driven Jacobian Adaptation Method for the Noisy Speech Recognition 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

참고문헌 (8)

이 논문을 인용한 문헌

저자의 다른 논문 :

정용주 (30)

연구과제 타임라인

전체(0) 논문(0) 특허(0) 보고서(0)

전체(0) 논문(0) 특허(0) 보고서(0)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

잡음음성인식을 위한 데이터 기반의 Jacobian 적응방식
A Data-Driven Jacobian Adaptation Method for the Noisy Speech Recognition 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper