[논문]디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술

서진호; 박호종

문제 정의

디지털 통신 시스템에서의 음성 인식 향상 방법의 개발을 위하여 우선 음성 부호화기에 의한 왜곡의 특성을 분석하고 그에 따라 왜곡된 정보의 보상 방법을 개발하도록 한다. 그림 2는 원 음성 신호와 IS-127 Enhanced Variable-Rate Codec (EVRC) 음성 부호화기를 통과하여 합성된 음성 신호의 스펙트럼을 비교한 것이다⑷.
그렇지 않을 경우 음성 인식기가 부호화기 정보를 전송받기 어려우며, 이 경우에는 통신 시스템에서 사용하는 모든 음성 부호화기를 이용하여 음성 인식기를 훈련시켜야 하며 각각의 독립적인 훈련에 비하여 음성 인식기의 성능은 저하된다. 따라서 이와 같은 문제점을 해결하기 위하여 각각의 음성 부호화기에 종속되지 않고 음성 부호화기의 종류에 관계없이 공통으로 적용 가능한 새로운 음성 인식 성능 향상 방법의 개발이 필요하며, 본 논문에서는 이와 같은 조건을 만족하는 스펙트럼 왜곡 보상 전처리 기술을 개발한다.
그렇지 않을 경우 음성 인식기가 부호화기 정보를 전송받기 어려우며, 이 경우에는 통신 시스템에서 사용하는 모든 음성 부호화기를 이용하여 음성 인식기를 훈련시켜야 하며 각각의 독립적인 훈련에 비하여 음성 인식기의 성능은 저하된다. 따라서 이와 같은 문제점을 해결하기 위하여 각각의 음성 부호화기에 종속되지 않고 음성 부호화기의 종류에 관계없이 공통으로 적용 가능한 새로운 음성 인식 성능 향상 방법의 개발이 필요하며, 본 논문에서는 이와 같은 조건을 만족하는 스펙트럼 왜곡 보상 전처리 기술을 개발한다.
중첩 된 영역에서 음성의 특성은 높은 상관도를 가지며 중첩 영역이 클 수로 상관도도 증가하게 될 것이다. 따라서 현재 프레임의 가중치 함수를 적용 할 때 상관도가 높은 이전 프레임들의 가중치 정보를 동시에 이용하면 성능을 더 높일 수 있다 이 방법을 적용하기 위하여 우선 시간 영역에서 중첩되는 프레임 사이의 특성에 높은 상관도가 존재하는지 확인하였다. 표 1은 각기 다른 화자의 단어 발성 중에서 단어를 무작위로 뽑아 프레임 에너지의 상관 계수를 계산한 결과이며, 예상대로 시간 영역에서 중첩 되는 프레임들 사이에 상당히 높은 상관도가 존재하는 것을 확인할 수 있다 따라서 이를 토대로 시간에 따른 점진적 가중치 적용 방법을 적용 할 수 있다.
본 논문에서 제안하는 전처리 기술은 주파수 영역에서의 가중치 함수 적용을 통하여 스펙트럼 왜곡을 보상하는 방법이다. 그림 3과 같이 PLP 과정의 DFT 단계에서 구한 스펙트럼 계수로부터 제안한 방법에 따라 가중치 함수를 구하고, 이 가중치 함수를 원 스펙트럼 계수에 적용하여 변형된 스펙트럼 계수를 구하고, 이로부터 최종 켑스트럼 계수를 구하는 과정을 거친다.
그러나 음성 부호화 기의 동작은 미리 정해진 방식에 따라 진행되므로 어느 정도 왜곡 현상의 분석이 가능하고 이에 따라 왜곡을 보상하는 전략이 가능하게 된다. 본 논문에서는 두 가지 문제점 중 음성 부호화기에 의한 음성 신호 왜곡을 보상 하여 음성 인식 성능을 향상시키는 문제만을 다룬다.
그러나 음성 부호화 기의 동작은 미리 정해진 방식에 따라 진행되므로 어느 정도 왜곡 현상의 분석이 가능하고 이에 따라 왜곡을 보상하는 전략이 가능하게 된다. 본 논문에서는 두 가지 문제점 중 음성 부호화기에 의한 음성 신호 왜곡을 보상 하여 음성 인식 성능을 향상시키는 문제만을 다룬다.
본 논문에서는 디지털 통신 시스템에서의 서버 기반 음성 인식 성능 향상을 위한 새로운 방법으로서 음성 인식 전단 (front-end)에 적용되는 전처리 (pre processing) 기술을 제안한다. 전처리 기술은 입력 신호에 직접 적용되어 음성 부호화기에 의하여 왜곡된 주파수 정보를 보상하며, 특히 입력 신호의 특성이 시간에 따라 변하는 것에 적응하여 프레임별로 서로 다른 보상 규칙을 결정한다.
본 논문에서는 디지털 통신 시스템에서의 서버 기반 음성 인식 성능 향상을 위한 새로운 방법으로서 음성 인식 전단 (front-end)에 적용되는 전처리 (pre processing) 기술을 제안한다. 전처리 기술은 입력 신호에 직접 적용되어 음성 부호화기에 의하여 왜곡된 주파수 정보를 보상하며, 특히 입력 신호의 특성이 시간에 따라 변하는 것에 적응하여 프레임별로 서로 다른 보상 규칙을 결정한다.
이를 해결하기 위한 기존의 방법은 각 음성 부호화기의 특성을 포함하여 인식기를 새로 훈련하는 것이며, 이는 음성 인식기가 각 음성 부호화기에 종속되고 음성 부호화기마다 서로 다른 모델이 적용되는 문제점을 가진다. 본 논문에서는 이과 같은 문제점을 해결하기 위하여 모든 CELP 음성 부호화기에 공통적으로 적용 할 수 있는 음성 인식 향상 방법을 제안하였다. 음성 부호화기에 의하여 음성 신호의 스펙트럼에 왜곡이 발생하고 이로 인하여 인식기의 성능이 저하된다.
중첩 된 영역에서 음성의 특성은 높은 상관도를 가지며 중첩 영역이 클 수로 상관도도 증가하게 될 것이다. 따라서 현재 프레임의 가중치 함수를 적용 할 때 상관도가 높은 이전 프레임들의 가중치 정보를 동시에 이용하면 성능을 더 높일 수 있다 이 방법을 적용하기 위하여 우선 시간 영역에서 중첩되는 프레임 사이의 특성에 높은 상관도가 존재하는지 확인하였다. 표 1은 각기 다른 화자의 단어 발성 중에서 단어를 무작위로 뽑아 프레임 에너지의 상관 계수를 계산한 결과이며, 예상대로 시간 영역에서 중첩 되는 프레임들 사이에 상당히 높은 상관도가 존재하는 것을 확인할 수 있다 따라서 이를 토대로 시간에 따른 점진적 가중치 적용 방법을 적용 할 수 있다.

가설 설정

스펙트럼 정렬 및 가중치 함수 적용을 통한 스펙트럼 보상. (a) 스펙트럼 크기 순 정려 (b) 중간 가중치 함수. (c) 실제 적용된 가중치 함수

제안 방법

그리고 본 논문에서는 디지털 통신 시스템에 가장 널리 사용되고 있는 세 가지 표준 음성 부호화기 인 IS-127 EVRC, ITU G.729 CS-ACELP, IS-96 QCELP 부호화기를 사용하여 문제점을 분석하고 성능 향상 방법을 개발하며 최종적으로 개발된 방법의 성능을 측정 한다[4-6].
729 GS-ACELP, IS-96 QCELP)에 입력하여 얻은 왜곡된 음성 신호를 가지고 훈련시킨 모델이다. 따라서 음성 인식기 동작 환경은 크게 세 가지(원 음성 모델, 전처리 모듈이 포함된 원 음성 모델 왜곡된 음성 모델)가 있으며 각각의 경우에 대하여 동일한 입력에 대한 음성 인식률을 측정하였다.
본 논문에서 제안한 스펙트럼 보상 방법의 성능 분석을 위하여 HTK 3.1 을 이용하는 고립 단어 인식기를 설계하여 사용하였다 특징 파라미터는 Perceptual Linear Prediction (PLP) 기반의 13차 켑스트럼 계수를 사용흐卜 였고 실험에 사용된 음성 신호는 현재 이동 통신에 서비스되는 규격과 동일한 조건으로 하기 위하여 8kHz의 샘플링을 갖는 음성 데이터를 사용하였다⑻.
본 논문에서 제안한 스펙트럼 보상 방법의 성능 분석을 위하여 HTK 3.1을 이용하는 고립 단어 인식기를 설계하여 사용하였다 특징 파라미터는 Perceptual Linear Prediction (PLP) 기반의 13차 켑스트럼 계수를 사용하였고 실험에 사용된 음성 신호는 현재 이동 통신에 서비스되는 규격과 동일한 조건으로 하기 위하여 8kHz의 샘플링을 갖는 음성 데이터를 사용하였다⑻. 음성 데이터 들은 SITEC에서 제작한 클린 스피치 PBW452단어 DB'이며 훈련 데이터는 클린 스피치 30명분 개인당 452단어씩 총 13,560단어이며 테스트 데이터는 8명분의 3,616단어이다.
음성 부호화기에 의하여 왜곡된 음성 신호의 특징적 현상을 분석하여 다음 네 가지의 왜곡 보상 과정으로 구성된 전처리 기술을 개발 하였다.
여기에 (b)의 중간 가중치 함수를 곱하여 작은 크기의 스펙트럼 영역에 큰 가중치가 적용되도록 하여 스펙 트럼 왜곡을 보상하는 것이다. 이 방법에서 중간 가중치 함수를 정하는 것이 핵심이며, [7]에서 사용하였던 고정 가중치 함수의 문제점을 해결하기 위하여 가변 가중치 함수를 사용하며, 특히 가중치 함수에 의하여 실제로 크기가 변하게 되는 영역을 전체 스펙트럼의 크기를 분석하여 정하도록 한다. 즉, 스펙트럼의 전체 평균을 구하고 정렬된 스펙트럼에서 전체 스펙트럼의 평균값 이하 영역에만 완만한 가중치 함수를 적용하고 나머지 영역에는 가중치 1.
이 방법에서 중간 가중치 함수를 정하는 것이 핵심이며, [기에서 사용하였던 고정가중치 함수의 문제점을 해결하기 위하여 가변 가중치 함수를 사용하며, 특히 가중치 함수에 의하여 실제로 크기가 변하게 되는 영역을 전체 스펙트럼의 크기를 분석하여 정하도록 한다.
그러나 첫 번째 가중치 함수 결정 과정 에서 고주파 영역의 스펙트럼 보다 더 작은 스펙트럼이 많이 존재하는 경우 고주파 영역의 스펙트럼이 가중치를 받는 순위에 들지 못 하거나 또는 매우 작은 가중치를 가지게 되는 경우가 생긴다. 이 상황에 대한 예외 처리를 두어 첫 단계에서 매우 작은 가중치를 적용 받은 고주파 영역에 대하여 첫 과정에서 얻은 가중치 함수를 증가시켜 변형된 가중치 함수를 새로 결정하며, 다음의 단계로 진행된다. (i) 첫 과정에서 결정된 가중치 함수의 고주파 영역에서 가중치 값과 기준값 비교, (ii) 기준값 보다 작은 가중치 영역 선택, (iii) 선택된 가중치 영역에 대하여 증가된 가중치 적용, (iv) 새로운 가중치 함수 확정.
그러나 첫 번째 가중치 함수 결정 과정 에서 고주파 영역의 스펙트럼 보다 더 작은 스펙트럼이 많이 존재하는 경우 고주파 영역의 스펙트럼이 가중치를 받는 순위에 들지 못 하거나 또는 매우 작은 가중치를 가지게 되는 경우가 생긴다. 이 상황에 대한 예외 처리를 두어 첫 단계에서 매우 작은 가중치를 적용 받은 고주파 영역에 대하여 첫 과정에서 얻은 가중치 함수를 증가시켜 변형된 가중치 함수를 새로 결정하며, 다음의 단계로 진행된다. (i) 첫 과정에서 결정된 가중치 함수의 고주파 영역에서 가중치 값과 기준값 비교, (ii) 기준값 보다 작은 가중치 영역 선택, (iii) 선택된 가중치 영역에 대하여 증가된 가중치 적용, (iv) 새로운 가중치 함수 확정.
음성 부호화기에 의하여 음성 신호의 스펙트럼에 왜곡이 발생하고 이로 인하여 인식기의 성능이 저하된다. 이를 해결하기 위하여 왜곡된 스펙트럼을 보상하는 전처리 방법을 제안하며, 스펙트럼의 크기 정렬에 따른 보상, 고주파 영역에서의 예외처리, 시간에 따른 점진적 보상, 대역별 에너지 보상 등의 네 단계에 따라 스펙트럼 가중치 함수를 구하여 스펙트럼 왜곡을 보상하며, 보상된 스펙트럼으로부터 음성 특성을 추출하여 기존의 음성 인식기에 입력시킨다. 제안한 전처리 보상 방법을 적용하여 인식 성능이 크게 향상되는 것을 확인하였고, 특히 서로 다른 음성 부호화기에 대하여 동일한 보상 방법을 적용하여 성능이 향상되는 것을 확인하였다.
제안한 스펙트럼 보상 방법의 성능을 상대적으로 비교하기 위하여 두 개의 음성 인식 모델을 생성하였다. 하나는 기존의 음성 인식기에 해당하는 것으로서 원 음성 신호를 가지고 만든 모델이며, 다른 한 가지는 원 음성 신호를 3개의 음성 부호화기 (IS-127 EVRC, ITU G.
프레임의 진행 시간이 10msec에 불과하므로 프레임 에너지에 급격한 감소가 발생하는 것은 입력 신호의 특성보다는 음성 부호화기의 순간적인 성능 저하로 인하여 발생할 확률이 높으며, 이에 따라 프레임 에너지에 큰 감소가 발생하면 예외 처리를 하도록 한다. 즉, 필터 뱅크에서 각 대역의 에너지가 이전 프레임의 해당 대역에 비하여 크게 저하되면 해당 대역에서 부호화에 의한 스펙트럼 왜곡이 매우 크다고 판단하여 대역에 일정한 추가 가중치를 적용하여 대역의 에너지를 증가시키도록 한다.
시간에 따른 점진적 가중치 적용 방법에 의하여 현재 프레임의 가중치 함수는 이전 프레임에서 사용하였던 가중치 함수에 따라 변형되어 최종 결정된다. 즉, 현재 프레임에 대하여 앞의 두 단계에 의하여 가중치 함수를 우선 구하고, 이전 프레임의 가중치 함수를 고려하여 추가 변형을 적용한다. 가중치 함수에 대한 추가 변형은 크게 두 가지 상황으로 나누어진다.
시간에 따른 점진적 가중치 적용 방법에 의하여 현재 프레임의 가중치 함수는 이전 프레임에서 사용하였던 가중치 함수에 따라 변형되어 최종 결정된다. 즉, 현재 프레임에 대하여 앞의 두 단계에 의하여 가중치 함수를 우선 구하고, 이전 프레임의 가중치 함수를 고려하여 추가 변형을 적용한다. 가중치 함수에 대한 추가 변형은 크게 두 가지 상황으로 나누어진다.

대상 데이터

음성 데이터 들은 SITEC에서 제작한 클린 스피치 PBW452단어 DB'이며 훈련 데이터는 클린 스피치 30명분 개인당 452단어씩 총 13,560단어이며 테스트 데이터는 8명분의 3,616단어이다.
음성 데이터들은 SITEC에서 제작한 클린 스피치 PBW452단어 I沮 이며 훈련 데이터는 클린 스피치 30명분 개인당 452단어씩 총 13, 560단어이며 테스트 데이터는 8명분의 3, 616단어이다.

이론/모형

Tcdole 2. Word accuracy using the proposed pre-processing method.

성능/효과

7%가 되어 제안한 방법에 비하여 성능이 향상되지만, 제안한 방법은 새로운 훈련이 필요 없이 기존의 인식 모델을 그대로 사용하는 장점을 가진다. G.729와 QCELP에 의하여 왜곡된 신호에 대하여서도 동일한 전처리 방법을 사용하여 많은 인식률 향상을 얻을 수 있으며 이를 통하여 동일한 전처리 방법으로 다른 종류의 음성 부호화기에 의한 스펙트럼 왜곡을 보상하고, 그 결과 제안한 방법이 모든 통신 환경에 공통적으로 적용될 수 있는 것을 확인할 수있다.
7%가 되어 제안한 방법에 비하여 성능이 향상되지만, 제안한 방법은 새로운 훈련이 필요 없이 기존의 인식 모델을 그대로 사용하는 장점을 가진다. G.729와 QCELP에 의하여 왜곡된 신호에 대하여서도 동일한 전처리 방법을 사용하여 많은 인식률 향상을 얻을 수 있으며 이를 통하여 동일한 전처리 방법으로 다른 종류의 음성 부호화기에 의한 스펙트럼 왜곡을 보상하고, 그 결과 제안한 방법이 모든 통신 환경에 공통적으로 적용될 수 있는 것을 확인할 수있다.
첫 번째는 중첩 되는 이전 프레임에서 가중치를 받은 주파수 영역이 현재 프레임에서 가중치를 받지 못 한 경우이며, 이 때에는 현재 프레임의 해당 주파수 영역에 대하여 이전 프레임 가중치의 35%를 추가로 적용한다. 두 번째는, 중첩되는 이전 프레임에서는 가중치를 받지 못하였으나 현재 프레임에서 가중치를 받은 경우이며, 이 때에는 해당 주파수 영역에 대하여 현재 프레임의 가중치를 35% 감소시켜. 새로운 가중치 함수를 최종 생성한다.
6%의 인식률 향상을 얻을 수있다. 만일 에 의하여 왜곡된 신호로 직접 훈련한 모델의 인식기에 입력시키면 인식률이 82.7%가 되어 제안한 방법에 비하여 성능이 향상되지만, 제안한 방법은 새로운 훈련이 필요 없이 기존의 인식 모델을 그대로 사용하는 장점을 가진다. G.
음성 부호화기에 의하여 왜곡된 음성 신호는 위에서 언급하였듯이 원 음성 신호보다 스펙트럼의 에너지가 감소된다. 신호의 부호화 성능이 높아 왜곡이 작은 경우 음성 신호의 스펙트럼 에너지의 감소량은 비교적 작아지지만 그렇지 않을 경우에는 스펙트럼 에너지의 감소 현상이 두드러지게 나타나며, 실험에 의하면 특정 프레임 에서 갑자기 많은 에너지 감소가 발생하는 경우가 종종 발생하는 것을 확인할 수 있다. 프레임의 진행 시간이 10msec에 불과하므로 프레임 에너지에 급격한 감소가 발생하는 것은 입력 신호의 특성보다는 음성 부호화기의 순간적인 성능 저하로 인하여 발생할 확률이 높으며, 이에 따라 프레임 에너지에 큰 감소가 발생하면 예외 처리를 하도록 한다.
음성 부호화기에 의하여 왜곡된 음성 신호는 위에서 언급하였듯이 원 음성 신호보다 스펙트럼의 에너지가 감소된다. 신호의 부호화 성능이 높아 왜곡이 작은 경우 음성 신호의 스펙트럼 에너지의 감소량은 비교적 작아지지만 그렇지 않을 경우에는 스펙트럼 에너지의 감소 현상이 두드러지게 나타나며, 실험에 의하면 특정 프레임 에서 갑자기 많은 에너지 감소가 발생하는 경우가 종종 발생하는 것을 확인할 수 있다. 프레임의 진행 시간이 10msec에 불과하므로 프레임 에너지에 급격한 감소가 발생하는 것은 입력 신호의 특성보다는 음성 부호화기의 순간적인 성능 저하로 인하여 발생할 확률이 높으며, 이에 따라 프레임 에너지에 큰 감소가 발생하면 예외 처리를 하도록 한다.
이를 해결하기 위하여 왜곡된 스펙트럼을 보상하는 전처리 방법을 제안하며, 스펙트럼의 크기 정렬에 따른 보상, 고주파 영역에서의 예외처리, 시간에 따른 점진적 보상, 대역별 에너지 보상 등의 네 단계에 따라 스펙트럼 가중치 함수를 구하여 스펙트럼 왜곡을 보상하며, 보상된 스펙트럼으로부터 음성 특성을 추출하여 기존의 음성 인식기에 입력시킨다. 제안한 전처리 보상 방법을 적용하여 인식 성능이 크게 향상되는 것을 확인하였고, 특히 서로 다른 음성 부호화기에 대하여 동일한 보상 방법을 적용하여 성능이 향상되는 것을 확인하였다.
가중치 함수에 대한 추가 변형은 크게 두 가지 상황으로 나누어진다. 첫 번째는 중첩 되는 이전 프레임에서 가중치를 받은 주파수 영역이 현재 프레임에서 가중치를 받지 못 한 경우이며, 이 때에는 현재 프레임의 해당 주파수 영역에 대하여 이전 프레임 가중치의 35%를 추가로 적용한다. 두 번째는, 중첩되는 이전 프레임에서는 가중치를 받지 못하였으나 현재 프레임에서 가중치를 받은 경우이며, 이 때에는 해당 주파수 영역에 대하여 현재 프레임의 가중치를 35% 감소시켜.
이와 같은 방법을 통하여 새로운 인식기 설계와 재훈련 없이 매우 간단하게 기존 음성 인식 기의 음성 인식 성능을 향상시킬 수 있다. 특히, 제안하는 전처리 왜곡 보상 방법은 특정한 음성 부호화기 에 제한적으로 적용되는 것이 아니라, 현재 통신 시스템에서 가장 널리 사용되는 Code-Excited Linear Prediction (CELP) 구조의 모든 음성 부호화기에 공통으로 적용이 가능한 장점을 가진다. 따라서 제안하는 전처리 왜곡 보상 방법은 디지털 통신 시스템에 이미 설치되어 있는 음성 인식기에 매우 간단히 적용될 수 있다본 논문은 다음과 같이 구성된다.
표 2에 정리되어 있듯이 EVRC에 의하여 왜곡된 음성 신호를 그대로 기존의 음성 인식기 (원 음성 모델)에 입력시키면 단어 인식률이 64.9%이지만, 동일한 신호를 제안한 전처리 모듈을 통과한 후 인식기에 입력시키면 인식률이 80.5%가 되어 15.6%의 인식률 향상을 얻을 수있다. 만일 에 의하여 왜곡된 신호로 직접 훈련한 모델의 인식기에 입력시키면 인식률이 82.
표 2에 정리되어 있듯이 EVRC에 의하여 왜곡된 음성 신호를 그대로 기존의 음성 인식기 (원 음성 모델)에 입력시키면 단어 인식률이 64.9%이지만, 동일한 신호를 제안한 전처리 모듈을 통과한 후 인식기에 입력시키면 인식률이 80.5%가 되어 15.6%의 인식률 향상을 얻을 수있다. 만일 에 의하여 왜곡된 신호로 직접 훈련한 모델의 인식기에 입력시키면 인식률이 82.

후속연구

특히, 제안하는 전처리 왜곡 보상 방법은 특정한 음성 부호화기 에 제한적으로 적용되는 것이 아니라, 현재 통신 시스템에서 가장 널리 사용되는 Code-Excited Linear Prediction (CELP) 구조의 모든 음성 부호화기에 공통으로 적용이 가능한 장점을 가진다. 따라서 제안하는 전처리 왜곡 보상 방법은 디지털 통신 시스템에 이미 설치되어 있는 음성 인식기에 매우 간단히 적용될 수 있다본 논문은 다음과 같이 구성된다. 2장에서 디지털 통신 시스템에서의 음성 인식기 동작을 간단히 설명하고, 3장에서 음성 인식의 관점에서 음성 부호화기에 의한 신호의 왜곡을 분석한다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술
Pre-Processing for Performance Enhancement of Speech Recognition in Digital Communication Systems 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

참고문헌 (8)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술 Pre-Processing for Performance Enhancement of Speech Recognition in Digital Communication Systems 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

참고문헌 (8)

이 논문을 인용한 문헌

저자의 다른 논문 :

박호종 (45)

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

디지털 통신 시스템에서의 음성 인식 성능 향상을 위한 전처리 기술
Pre-Processing for Performance Enhancement of Speech Recognition in Digital Communication Systems 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper