최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기국가/구분 | 한국(KR)/공개특허 | |
---|---|---|
국제특허분류(IPC8판) |
|
|
출원번호 | 10-2020-0087573 (2020-07-15) | |
공개번호 | 10-2022-0009183 (2022-01-24) | |
DOI | http://doi.org/10.8080/1020200087573 | |
발명자 / 주소 | ||
출원인 / 주소 |
|
|
대리인 / 주소 |
|
|
심사진행상태 | 취하(심사미청구) | |
법적상태 | 취하 |
본 발명은 자기 지도 학습을 이용한 VAE-GAN 구조 기반의 음성 발화 스타일 변환 방법 및 장치에 관한 것으로, 별도의 라벨 데이터 추가 없이 모델을 학습하는 음성 발화 스타일 변환 방법 및 장치를 제공하기 위함이다. 본 발명을 통해 더 정확한 발화 스타일 분포를 추정하고 좋은 품질의 음성신호를 생성할 수 있다.
입력된 음성신호의 특징을 추출하는 단계;상기 추출된 음성신호의 특징을 VAE-GAN 기반 모델을 통해 학습하는 단계; 상기 추출된 음성신호의 특징과 자기 지도 학습 네트워크를 이용해 데이터를 생성하는 단계; 및상기 생성된 데이터를 상기 VAE-GAN 기반 모델에 공유하여 학습하고 출력 음성 신호를 생성하는 단계를 포함하는, 자기 지도 학습을 이용한 음성 발화 스타일 변환 방법.
해당 특허가 속한 카테고리에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.