최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기Journal of the convergence on culture technology : JCCT = 문화기술의 융합, v.8 no.3, 2022년, pp.469 - 475
김광현 (대전대학교 대학원 정보통신공학과) , 권철홍 (대전대학교 정보통신.전자공학과)
To train the model of the deep learning-based single-speaker TTS system, a speech DB of tens of hours and a lot of training time are required. This is an inefficient method in terms of time and cost to train multi-speaker or personalized TTS models. The voice cloning method uses a speaker encoder mo...
Y. Jia, Y. Zhang, R. Weiss, et al., "Transfer learning from speaker verification to multispeaker text-to-speech synthesis", ArXiv:https://arxiv.org/pdf/1806.04558.pdf, Jan. 2019
A. Papir, I. Wan, Q. Wang, et al., "Generalized end-to-end loss for speaker verification", ArXiv: https://arxiv.org/pdf/1710.10467.pdf, Nov. 2020
E. Elsen, N. Kalchbrenner, K. Simonyan, et al,, "Efficient neural audio synthesis", ArXiv. https://arxiv.org/pdf/1802.08435.pdf, June 2018.
K. H. Kim, "A study on multi-speaker TTS using speaker recognition technology", Master Thesis, Graduate School of Daejeon Univ. 2022
C. Jemine, "Real-time voice cloning", Master Thesis, Liege University, 2019
Real-time Voice Cloning, https://github.com/CorentinJ/Real-Time-Voice-Cloning
Zeroth-Korean, Korean open source speech corpus for speech recognition by Zeroth project, https://www.openslr.org/40/
한국전자통신연구원, 음성 학습 데이터, https://aiopen.etri.re.kr/service_dataset.php?categoryvoice
Korean Forced Aligner, https://github.com/hyung8758/Korean_FA
D. Povey, A. Ghoshal, G. Boulianne, et al., "The Kaldi speech recognition toolkit", Proceedings of the IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2011, 2011
한국지능정보사회진흥원, AI Hub, 한국어 자유 발화 음성 데이터, https://aihub.or.kr/aidata/105
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.