[논문]음성 인식용 데이터베이스 검증시스템을 위한 새로운 음성 인식 성능 지표

지승은; 김우일

doi:10.6109/jkiice.2016.20.3.464

문제 정의

본 시스템에서는 윈도우즈 상에서 제작된 GUI 기반의 어플리케이션이며 개발 언어로는 Tcl/tk(Tool Command Language and Tk GUI)를 사용하였다[6]. Tcl/tk는 스크립트 언어인 Tcl과 Tk GUI Toolkit을 말하며, Tcl은 인터프리터 스크립트 언어로서 이러한 언어의 대표적인 특징인 멀티 플랫폼에서의 실행 및 확장을 목적으로 선택하였다. 또한 Tcl은 본 시스템에서 음성 특성 지표의 시각화를 위해 사용하는 패키지인 Snack Sound Toolkit[7]을 지원한다.
본 시스템은 음성 신호에서 추출할 수 있는 여러 가지 음성 특성 지표를 이용하여 인식 성능을 검증한다. 따라서 검증 시스템의 핵심 요소인 다양한 음성 특징 추출 알고리즘을 소개하며 시스템에 적용된 새로운 음성 인식 성능 지표를 제안한다. 효과적인 음성 인식 성능 지표를 생성하기 위해 다수의 선행 연구가 진행되어 왔다[1, 2].
본 논문에서는 음성의 특징을 이용한 음성 인식용 데이터베이스 검증 시스템의 개발 내용을 소개하고 이 시스템의 핵심 기술인 음성 특성 지표 추출 알고리즘을 설명하였다. 또한 선행 연구에서부터 본 시스템에 필요한 효과적인 음성 인식 성능 지표를 생성하기 위해 대표적인 음성 인식 성능 지표인 단어 오인식률과 상관도가 높은 여러 가지 특성 지표들을 채택, 조합하여 새로운 성능 지표를 제안해왔다. 본 실험에서는 선행 연구에서 채택했던 이차적인 음성 인식기를 사용해 추출하는 지표인 음향 모델 확률 값을 GMM 음향 모델 확률 값으로 대체 후 조합함으로써 시스템 구축 시 다른 음성 인식기에 대한 의존성을 줄였다.
따라서 본 논문에서는 음향 모델 확률 값을 별도의 음성 인식기 없이 계산 가능한 GMM 모델 확률 값으로 대체하고 이를 조합하여 새로운 음성 인식 성능 지표를 생성한다. 또한 이를 이용하여 성능을 평가하고 시스템에서의 성능 평가 기준인 단어 오인식률을 대체함으로써 음성 인식용 데이터베이스 검증 시스템의 독립성과 편의성을 향상시키고자 한다.
기존 연구에서는 다양한 특성 지표를 여러 방법으로 조합, 추가하여 더 효과적인 음성 인식 성능 지표를 생성하기 위해 진행 된 실험 결과를 소개하였다[3-5]. 본 논문에서는 선행 연구의 문제점이었던 특징을 추출하는 단계에서 부차적인 음성인식기를 사용하는 점을 해결하기 위한 새로운 조합을 제안한다.
본 논문에서는 앞에서 기술한 문제를 해결할 수 있는 윈도우즈 환경 기반의 음성 인식용 데이터베이스 검증 시스템의 개발 내용을 소개한다. 본 시스템은 음성 신호에서 추출할 수 있는 여러 가지 음성 특성 지표를 이용하여 인식 성능을 검증한다.
본 논문에서는 음성의 특징을 이용한 음성 인식용 데이터베이스 검증 시스템의 개발 내용을 소개하고 이 시스템의 핵심 기술인 음성 특성 지표 추출 알고리즘을 설명하였다. 또한 선행 연구에서부터 본 시스템에 필요한 효과적인 음성 인식 성능 지표를 생성하기 위해 대표적인 음성 인식 성능 지표인 단어 오인식률과 상관도가 높은 여러 가지 특성 지표들을 채택, 조합하여 새로운 성능 지표를 제안해왔다.
본 장에서는 음성 인식용 데이터베이스 검증 시스템의 주 기능인 음성의 특성 지표를 비교하여 음성 인식 성능을 검증하는 단계에 사용되는 특성 지표 추출 기능을 소개한다. 본 시스템의 개발을 위해 선행 연구로 여러 가지 음성 특성 지표를 분석하였고, 다양한 특징 추출 소프트웨어를 이용하여 어플리케이션에 총 11개의 특성 지표를 출력할 수 있게 하였다.

제안 방법

음성 지속 시간은 음성 신호의 길이를 음절의 수로 나눈 값으로 데이터 당 발화 속도를 수치로 표현한 값이다. SPHINX-3 인식기를 통해 각 데이터의 음성 인식 결과를 구하고 CMU(Carnegie Mellon University)에서 제공하는 단어 사전을 이용해 각 인식 결과에서 음절수를 계산하였다.
info’ 확장자의 음성 특징 파일을 생성하기 위해 리눅스 환경에서 스크립트를 구현하였다.
Snack Sound Toolkit은 Cross-platform 라이브러리로서, 오디오 파일을 입력 받아 스펙트럼 분석 및 필터링 등의 음성 신호 처리 기능을 제공하며 이 밖에도 Python과 Ruby와 같은 프로그래밍 언어에 바인딩이 가능하다. 개발한 어플리케이션에서는 Snack Sound Toolkit을 이용하여 음성 데이터의 파형과 주파수 성분을 출력한 스펙트로그램, 음성의 피치 정보를 출력하는데 사용하였다.
단어 오인식률은 깨끗한 파일의 Transcription과 오염된 음성 파일의 인식 결과를 비교하여 발화한 단어 중 정확히 인식한 단어의 비율을 나타내는 대표적인 음성 인식 성능 지표이며 본 시스템에서는 SPHINX-3 인식기를 사용해 구하였다.
이와 같이 음성 인식기를 이용하여 음성 특성 지표를 추출하기 위해서는 음성 인식 시스템을 별도로 구축해야하는 부가적인 처리 과정이 필요하다. 따라서 본 논문에서는 음향 모델 확률 값을 별도의 음성 인식기 없이 계산 가능한 GMM 모델 확률 값으로 대체하고 이를 조합하여 새로운 음성 인식 성능 지표를 생성한다. 또한 이를 이용하여 성능을 평가하고 시스템에서의 성능 평가 기준인 단어 오인식률을 대체함으로써 음성 인식용 데이터베이스 검증 시스템의 독립성과 편의성을 향상시키고자 한다.
본 시스템에서는 SPHINX-3과 깨끗한 음성 데이터베이스를 이용하여 구축한 음성 인식기의 음향 모델과 언어 모델의 확률 값을 구하였다. 또한 같은 음성 데이터베이스로 HTK(Hidden Markov Model Toolkit)를 이용하여 GMM 모델을 훈련하고 입력 음성의 GMM 모델 확률 값을 구하였다.
어플리케이션을 실행한 후, 오염된 음성 데이터베이스가 저장된 경로를 입력하면 시스템 하단에 해당 폴더의 파일 리스트가 출력되며 자동으로 입력 파일과 같은 이름의 깨끗한 음성 파일의 특징 정보를 동시 출력한다. 또한 해당 폴더의 데이터베이스 별 음성 특징들의 평균값을 출력하여, 보다 효율적인 음성 데이터 분석이 가능하도록 하였다. 이 기능을 실행하기 위해서 음성 데이터가 저장되는 폴더와 추출한 특징 파일이 저장되는 폴더, MFCC(Mel Frequency Cepstral Coefficient) 계수 유사도[5]의 시각화를 위한 수치를 저장하는 폴더 총 3개의 최상위 폴더가 필요하다.
입력 된 음성 특징으로 구한 모델 확률 값은 훈련된 이상적인 모델과 유사할수록 큰 값을 갖기 때문에 음성 인식 성능 지표로 쓰일 수 있다. 본 시스템에서는 SPHINX-3과 깨끗한 음성 데이터베이스를 이용하여 구축한 음성 인식기의 음향 모델과 언어 모델의 확률 값을 구하였다. 또한 같은 음성 데이터베이스로 HTK(Hidden Markov Model Toolkit)를 이용하여 GMM 모델을 훈련하고 입력 음성의 GMM 모델 확률 값을 구하였다.
스펙트로그램은 스펙트럼을 시간 축으로 재 표현한 것으로 가로 축은 시간을 나타내며 세로 축은 주파수, 주파수 성분의 크기와 밀도를 색으로 나타낸다. 본 시스템에서는 Snack Sound Toolkit을 이용하여 스펙트로그램의 시각화를 구현하였다.
따라서 피치는 음성의 주기적 특성을 나타내는 지표이며 유성음과 무성음을 구분하기도 하는 등 음성의 많은 특징을 분석할 때 쓰이는 지표이다. 본 시스템에서는 Snack Sound Toolkit을 이용하여 피치의 시각화를 구현하였다.
PESQ는 음성 품질 평가를 위한 자동화된 테스트로써 MOS를 자동화 시킨 방법이다. 본 시스템에서는 윈도우즈 환경의 MATLAB을 이용해 오픈소스로 제공되는 스크립트를 사용하여 오염된 음성의 PESQ 값을 구하였다.
본 논문에서는 앞에서 기술한 문제를 해결할 수 있는 윈도우즈 환경 기반의 음성 인식용 데이터베이스 검증 시스템의 개발 내용을 소개한다. 본 시스템은 음성 신호에서 추출할 수 있는 여러 가지 음성 특성 지표를 이용하여 인식 성능을 검증한다. 따라서 검증 시스템의 핵심 요소인 다양한 음성 특징 추출 알고리즘을 소개하며 시스템에 적용된 새로운 음성 인식 성능 지표를 제안한다.
본 장에서는 음성 인식용 데이터베이스 검증 시스템의 주 기능인 음성의 특성 지표를 비교하여 음성 인식 성능을 검증하는 단계에 사용되는 특성 지표 추출 기능을 소개한다. 본 시스템의 개발을 위해 선행 연구로 여러 가지 음성 특성 지표를 분석하였고, 다양한 특징 추출 소프트웨어를 이용하여 어플리케이션에 총 11개의 특성 지표를 출력할 수 있게 하였다. 표 1는 본 시스템에 출력 되는 11개의 음성 특성 지표를 나타낸다.
또한 선행 연구에서부터 본 시스템에 필요한 효과적인 음성 인식 성능 지표를 생성하기 위해 대표적인 음성 인식 성능 지표인 단어 오인식률과 상관도가 높은 여러 가지 특성 지표들을 채택, 조합하여 새로운 성능 지표를 제안해왔다. 본 실험에서는 선행 연구에서 채택했던 이차적인 음성 인식기를 사용해 추출하는 지표인 음향 모델 확률 값을 GMM 음향 모델 확률 값으로 대체 후 조합함으로써 시스템 구축 시 다른 음성 인식기에 대한 의존성을 줄였다. 새로 조합한 음성 성능 지표는 Babble 잡음, 자동차 잡음 환경에서 모두 각 음성 특성 지표를 단독으로 사용할 때보다 단어 오인식률과 높은 상관도를 나타내어 음성 인식 성능을 예측하는데 효과적임을 입증하였다.
효과적인 음성 인식 성능 지표를 생성하기 위해 다수의 선행 연구가 진행되어 왔다[1, 2]. 본 연구에서는 기존의 대표적인 인식 성능 지표인 단어 오인식률(Word Error Rate, WER)과 상관관계(Correlation)가 높은 음성 특성 지표를 분석한 후, 이를 조합하여 새로운 음성 특성 지표를 생성하였다. 기존 연구에서는 다양한 특성 지표를 여러 방법으로 조합, 추가하여 더 효과적인 음성 인식 성능 지표를 생성하기 위해 진행 된 실험 결과를 소개하였다[3-5].
선행 실험으로 단어 오인식률과 상관도가 높은 음성 특성 지표를 알아내기 위해 다양한 음성 특성 지표를 분석하였으며, 그 중 GMM 음향 모델 확률 값, SNR, PESQ, MFCC 계수 유사도를 채택하여 새로운 음성 인식 성능 지표를 생성하였다. 새로운 음성 인식 성능 지표는 각 음성 특성 지표를 0~1의 범위로 정규화하고 단어 오인식률과 상관도에 비례하는 가중치를 적용하여 생성하였다. 아래 식 (1)은 오인식률과의 상관도에 비례하는 가중치 w_i의 계산식을 나타내며, 식 (2)는 새로운 성능 지표 I를 구하는 식이다.
선행 연구에서 단어 오인식률을 대체할 수 있는 새로운 성능 지표를 생성하기 위해, 분석한 여러 가지 특성 지표들 중 단어 오인식률과 상관도가 높은 특성 지표들을 채택하고 조합하여 새로운 성능 지표를 제안했다. 선행 실험으로 단어 오인식률과 상관도가 높은 음성 특성 지표를 알아내기 위해 다양한 음성 특성 지표를 분석하였으며, 그 중 GMM 음향 모델 확률 값, SNR, PESQ, MFCC 계수 유사도를 채택하여 새로운 음성 인식 성능 지표를 생성하였다. 새로운 음성 인식 성능 지표는 각 음성 특성 지표를 0~1의 범위로 정규화하고 단어 오인식률과 상관도에 비례하는 가중치를 적용하여 생성하였다.
현재 개발된 음성 데이터베이스 검증 시스템에 출력되는 음성 특성 지표들 가운데 음성 인식 성능 지표로써 단어 오인식률을 사용한다. 선행 연구에서 단어 오인식률을 대체할 수 있는 새로운 성능 지표를 생성하기 위해, 분석한 여러 가지 특성 지표들 중 단어 오인식률과 상관도가 높은 특성 지표들을 채택하고 조합하여 새로운 성능 지표를 제안했다. 선행 실험으로 단어 오인식률과 상관도가 높은 음성 특성 지표를 알아내기 위해 다양한 음성 특성 지표를 분석하였으며, 그 중 GMM 음향 모델 확률 값, SNR, PESQ, MFCC 계수 유사도를 채택하여 새로운 음성 인식 성능 지표를 생성하였다.
또한 해당 폴더의 데이터베이스 별 음성 특징들의 평균값을 출력하여, 보다 효율적인 음성 데이터 분석이 가능하도록 하였다. 이 기능을 실행하기 위해서 음성 데이터가 저장되는 폴더와 추출한 특징 파일이 저장되는 폴더, MFCC(Mel Frequency Cepstral Coefficient) 계수 유사도[5]의 시각화를 위한 수치를 저장하는 폴더 총 3개의 최상위 폴더가 필요하다. 이 중 본 시스템의 음성 데이터베이스의 폴더 구조는 그림 2와 같다.

대상 데이터

본 실험에서는 Babble 잡음, 자동차 잡음이 각각 5, 10, 15dB의 SNR로 오염된 TIMIT 음성 데이터베이스를 사용하였다. 단어 오인식률의 신뢰도를 위해 음성 파일 하나 당 발화하는 단어의 수가 많은 상위 120개의 파일을 채택하여 오염된 잡음 별로 360개씩 총 720개의 음성 데이터를 사용하였다.
본 실험에서는 Babble 잡음, 자동차 잡음이 각각 5, 10, 15dB의 SNR로 오염된 TIMIT 음성 데이터베이스를 사용하였다. 단어 오인식률의 신뢰도를 위해 음성 파일 하나 당 발화하는 단어의 수가 많은 상위 120개의 파일을 채택하여 오염된 잡음 별로 360개씩 총 720개의 음성 데이터를 사용하였다.
본 연구에서 개발한 음성 인식용 데이터베이스 검증 시스템은 윈도우즈 기반의 그래픽 사용자 인터페이스(Graphic User Interface, GUI)와 윈도우즈, 리눅스 환경에서 작성된 특징 추출 스크립트로 구성되어 있다. 리눅스 서버 상에서 검증할 음성 데이터베이스를 사용하여 스크립트를 실행 시키면 각 음성 데이터의 여러 가지 특징 지표를 출력한 결과 파일 형태로 특정 경로에 저장된다.

이론/모형

전체 특징 추출 기능은 리눅스 환경에서 Perl과 C Shell 스크립트 언어로 작성되었으며, 특성 지표 중 하나인 PESQ(Perceptual Evaluation of Speech Quality)는 윈도우즈 상에서 오픈 소스[8]를 사용하여 MATLAB 기반의 스크립트로 작성하였다. 또한 그밖에 음성의 다른 특성 지표를 추출하기 위해 HTK(Hidden Markov Model Toolkit)[9]와 SPHINX-3[10]를 이용해 구축한 음성 인식기를 활용하였다.
본 시스템에서는 윈도우즈 상에서 제작된 GUI 기반의 어플리케이션이며 개발 언어로는 Tcl/tk(Tool Command Language and Tk GUI)를 사용하였다[6]. Tcl/tk는 스크립트 언어인 Tcl과 Tk GUI Toolkit을 말하며, Tcl은 인터프리터 스크립트 언어로서 이러한 언어의 대표적인 특징인 멀티 플랫폼에서의 실행 및 확장을 목적으로 선택하였다.
따라서 SNR이 큰 음성일수록 음성의 인식 성능이 좋을 거라 표현할 수 있다. 선행 실험에서, SNR은 NIST에서 제공하는 STNR 기법[11]을 이용하여 계산하였다.
전체 특징 추출 기능은 리눅스 환경에서 Perl과 C Shell 스크립트 언어로 작성되었으며, 특성 지표 중 하나인 PESQ(Perceptual Evaluation of Speech Quality)는 윈도우즈 상에서 오픈 소스[8]를 사용하여 MATLAB 기반의 스크립트로 작성하였다. 또한 그밖에 음성의 다른 특성 지표를 추출하기 위해 HTK(Hidden Markov Model Toolkit)[9]와 SPHINX-3[10]를 이용해 구축한 음성 인식기를 활용하였다.

성능/효과

013 정도 낮은 상관도 보이나, GMM 모델 확률 값을 이용한 실험 결과에서도 음성 인식기를 사용한 선행 실험과 유사하게 각 특성 지표를 단독으로 사용할 때보다 조합하여 생성한 성능 지표가 단어 오인식률과 높은 수치의 상관도를 보이는 것을 확인할 수 있었다. 또한 특성 지표를 단독으로 사용할 때와 조합한 지표를 사용할 때, 오인식률과의 상관도 차이가 선행 연구의 결과보다 더 큰 비율로 상승하는 것을 볼 수 있다. 표 4는 babble 잡음 환경에서 실험한 결과를 보여주며 차례대로, 조합에 사용 되는 개별 특성 지표들과 단어 오인식률의 상관도 평균과, 생성한 성능 지표와 단어 오인식률의 상관도를 비교하여 상승한 정도를 나타낸다.
본 실험에서는 선행 연구에서 채택했던 이차적인 음성 인식기를 사용해 추출하는 지표인 음향 모델 확률 값을 GMM 음향 모델 확률 값으로 대체 후 조합함으로써 시스템 구축 시 다른 음성 인식기에 대한 의존성을 줄였다. 새로 조합한 음성 성능 지표는 Babble 잡음, 자동차 잡음 환경에서 모두 각 음성 특성 지표를 단독으로 사용할 때보다 단어 오인식률과 높은 상관도를 나타내어 음성 인식 성능을 예측하는데 효과적임을 입증하였다. 이 결과는 선행 연구의 결과보다 단어 오인식률과 다소 낮은 상관도를 보이지만 향후 다른 부차적인 인식기를 사용하지 않은 독립적인 시스템의 개발 진행을 위해 보다 효과적인 음성 성능 지표로 발전시켜 사용할 수 있음을 확인하였다.
새로 조합한 음성 성능 지표는 Babble 잡음, 자동차 잡음 환경에서 모두 각 음성 특성 지표를 단독으로 사용할 때보다 단어 오인식률과 높은 상관도를 나타내어 음성 인식 성능을 예측하는데 효과적임을 입증하였다. 이 결과는 선행 연구의 결과보다 단어 오인식률과 다소 낮은 상관도를 보이지만 향후 다른 부차적인 인식기를 사용하지 않은 독립적인 시스템의 개발 진행을 위해 보다 효과적인 음성 성능 지표로 발전시켜 사용할 수 있음을 확인하였다.
이를 조합하여 완성한 음성 특성 지표는 Babble 잡음, 자동차 잡음 환경에서 각각 단어 오인식률과 –0.7766, -0.7691의 상관도를 보인다.
7790의 상관도를 보였다. 절대치로 평균 0.013 정도 낮은 상관도 보이나, GMM 모델 확률 값을 이용한 실험 결과에서도 음성 인식기를 사용한 선행 실험과 유사하게 각 특성 지표를 단독으로 사용할 때보다 조합하여 생성한 성능 지표가 단어 오인식률과 높은 수치의 상관도를 보이는 것을 확인할 수 있었다. 또한 특성 지표를 단독으로 사용할 때와 조합한 지표를 사용할 때, 오인식률과의 상관도 차이가 선행 연구의 결과보다 더 큰 비율로 상승하는 것을 볼 수 있다.

핵심어	질문	논문에서 추출한 답변
	시중에 출시되기 전에 음성 인식 시스템에서 요구되는 작업은?	음성 인식 시스템은 시중에 출시되기 전에 시스템의 인식 성능을 검증하기 위해 대량의 음성 데이터베이스를 이용한 평가 작업이 요구된다. 또한 평가에 필요한 데이터베이스 구축 과정에서 데이터베이스를 구성하는각 음성 데이터가 음성 인식 성능 평가에 적합한지에 대한 검증 작업이 선행되어야 한다.
	본 연구에서 개발한 음성 인식용 데이터베이스 검증 시스템의 5개 패널은 어떠한 정보를 출력하는가?	그림 1과 같이 본 시스템은 다섯 개의 패널로 구성된다. 최상단의 창은 Information 패널로서, 왼쪽부터 순서대로 오염된 신호의 특징 정보, 데이터베이스의 평균 특징 정보, 깨끗한 신호의 특징 정보를 출력한다. 두 번째 Waveform 창은 오염된 음성과 레퍼런스 음성의 파형을 출력하며 세 번째와 네 번째 창은 음성 파형의 시간 축과 동일한 축을 사용하여 각각 음성의 스펙트로그램과 피치(Pitch) 정보를 나타낸다. 최 하단의 창에는 사용자가 지정한 경로인 음성 데이터 폴더의 음성 파일 리스트가 출력되며, 각 파일 이름을 클릭하여 해당 음성 파일의 정보를 나타낼 수 있다.
	음성 데이터의 적합성을 판단하기 위해 무엇이 필요한가?	또한 평가에 필요한 데이터베이스 구축 과정에서 데이터베이스를 구성하는각 음성 데이터가 음성 인식 성능 평가에 적합한지에 대한 검증 작업이 선행되어야 한다. 음성 데이터의 적합성을 판단하기 위해서는 음성 분석 분야 전문가의 자문이 필요하며, 대량의 데이터를 검증하는 과정에 시간과 비용이 요구된다. 이에 따라 음성 데이터베이스를 자동으로 분석하고 적합성을 평가하는 과정을 효과적으로 처리할 수 있는 음성 데이터베이스 검증 시스템이 필요하다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

음성 인식용 데이터베이스 검증시스템을 위한 새로운 음성 인식 성능 지표
A New Speech Quality Measure for Speech Database Verification System 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

질의응답

참고문헌 (11)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

음성 인식용 데이터베이스 검증시스템을 위한 새로운 음성 인식 성능 지표 A New Speech Quality Measure for Speech Database Verification System 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

질의응답

참고문헌 (11)

이 논문을 인용한 문헌

저자의 다른 논문 :

지승은 (3) 김우일 (23)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

음성 인식용 데이터베이스 검증시스템을 위한 새로운 음성 인식 성능 지표
A New Speech Quality Measure for Speech Database Verification System 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper