최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기디지털정책연구 = The Journal of digital policy & management, v.11 no.7, 2013년, pp.209 - 214
안찬식 (광운대학교 컴퓨터공학과) , 최기호 (광운대학교 컴퓨터공학과)
Improve the recognition performance of speech recognition systems as a method for recognizing human listening skills were incorporated into the system. In noisy environments by separating the speech signal and noise, select the desired speech signal. but In terms of practical performance of speech r...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
잡음을 분리하여 잡음에 강인한 음성 특징을 추출하기 위한 방법은? | 음성 인식 시스템의 실용적 측면에서 인식 성능이 떨어지는 주요 원인은 인식 환경 변화에 따른 잡음으로 인한 음성 검출이 정확하지 않은 문제와 학습 모델이 일치하지 않는 문제이다[4]. 따라서 음성 인식 성능 향상을 위해 잡음을 분리하여 잡음에 강인한 음성 특징을 추출하기 위해 본 논문에서는 감마톤의 ERB 필터 뱅크 켑스트럼을 이용하여 특징 추출하였고 음성 인식율 향상을 위해 음향 모델을 이용한 학습 모델을 구성하였다. | |
음성 인식 시스템의 실용적 측면에서 인식 성능이 떨어지는 주요 원인은? | 음성 인식 시스템의 실용적 측면에서 인식 성능이 떨어지는 주요 원인은 인식 환경 변화에 따른 잡음으로 인한 음성 검출이 정확하지 않은 문제와 학습 모델이 일치하지 않는 문제이다[4]. 따라서 음성 인식 성능 향상을 위해 잡음을 분리하여 잡음에 강인한 음성 특징을 추출하기 위해 본 논문에서는 감마톤의 ERB 필터 뱅크 켑스트럼을 이용하여 특징 추출하였고 음성 인식율 향상을 위해 음향 모델을 이용한 학습 모델을 구성하였다. | |
MFCC의 특징은? | 음성 인식을 위한 특징 추출은 인간의 청취 능력을 위주로 주관적인 인지 능력을 반영하여 기본적인 주파수를 mel-scale로 변형한 필터 뱅크를 비선형적으로 분포시켜 사용한다. 이러한 필터 뱅크를 사용해서 구한 음성 벡터를 MFCC라 한다[5]. |
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.