최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.13 no.3, 2013년, pp.1 - 8
유재권 ((주)파수닷컴) , 이경미 (덕성여자대학교 컴퓨터학과)
This paper proposes a new feature extraction algorithm to improve children's speech recognition in Korean. The proposed feature extraction algorithm combines three methods. The first method is on the vocal tract length normalization to compensate acoustic features because the vocal tract length in c...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
유아 대상의 교육용 프로그램에서 음성 인터페이스 사용시 장점은 무엇인가? | 특히, 유아 대상의 교육용 프로그램에서 음성 인터페이스의 사용은 유아에게 다양한 형태의 경험을 제공하고 언어 발달 능력을 향상시킬 수 있는 장점을 가지고 있다. 그러나 현재의 음성 인터페이스는 성인 음성 데이터의 접근 용이성 때문에 성인 대상으로 구축되어 있다. | |
음성은 무엇인가? | 음성은 사람들 사이에서 가장 자연스럽고 편리한 정보 교환의 수단으로서, 음성을 이용한 인터페이스는 사람과 컴퓨터와의 인터페이스(HCI : Human-Computer Interfac) 연구 분야에서 핵심 기술 중 하나이다. 음성인터페이스는 그 편의성 때문에 많은 어플리케이션에 적용하려는 시도가 이루어지고 있다[1][2]. | |
본 논문에서 유아 대상 한국어 음성인식 향상을 위해 제안한 특징추출 알고리즘은 무엇을 통합한 기법인가? | 제안하는 특징추출 알고리즘은 세 가지 방법을 통합한 기법이다. 첫째 성도의 길이가 성인에 비해 짧은 유아의 음향적 특징을 보완하기 위한 방법으로 성도정규화 방법을 사용한다. 둘째 성인의 음성과 비교했을 때 높은 스펙트럼 영역에 집중되어 있는 유아의 음향적 특징을 보완하기 위해 균일한 대역폭을 사용하는 방법이다. 마지막으로 실시간 환경에서의 잡음에 강건한 음성인식기 개발을 위해 스무딩 필터를 사용하여 보완하는 방법이다. 세 가지 방법을 통해 제안하는 특징추출 기법은 실험을 통해 유아의 음성인식 성능 향상에 도움을 준다는 것을 확인했다. |
유재권, 이경미, "한국어에서 성인과 유아의 음성 인식 비교", 한국콘텐츠학회논문지, Vol.11, No.5, pp.138-147, 2011.
A. Potamianos and S. Narayanan, "A review of the acoustic and linguistic properties of children's speech," in proc. of IEEE Multimedia Signal Processing Workshop, 2007.
D. Elenius and M. Blomberg, "Comparing speech recognition for adults and children," in proc. of FONETIK, pp.156-159, 2004.
D. Giuliani and M. Gerosa, "Investigating recognition of children's speech," in proc. of ICASSP, Vol.II, pp.137-140, 2003.
S. Das, D. Nix, and M. Picheny, "Improvements in children's speech recognition performance," in proc. of ICASSP, Vol.I, pp.433-436, 1998.
F. Zheng, G. Zhang, and Z. Song, "Comparison of different implementations of MFCC," Journal of computer science and technology, Vol.16, No.6, pp.582-589, 2001.
S. Umesh and R. Sinha, "A study of filter bank smoothing in MFCC features for recognition of children's speech," IEEE transactions on acoustic. speech and signal processing, Vol.15, No.8, pp.2418-2430, 2007.
유재권, 이경옥, 이경미, "한국어에서 만 3-5세 유아의 음성 데이터베이스 구축", 한국콘텐츠학회논문지, Vol.12, No.4, pp.52-59, 2012.
S. Young, G. Evermann, M. Gales, T. Hain, D. Kershaw, X. Liu, G. Moore, J. Odell, D. Ollason, D. Povey, V. Valtchev, and P. Woodland, "The HTK Book," Microsoft Corporation and Cambridge University Engineering Department, 2009.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.