최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기음성 감정 인식이란 음성 데이터만 사용하여 화자의 감정을 인식하는 모델을 말한다. 음성 감정 인식을 위해 음성 신호를 Mel-Spectrogram으로 변환 후 CNN과 LSTM을 결합한 모델을 제안한다. 기존 모델은 전체 음성 데이터 중 특정 구간만 학습한다. 본 논문에서 제안하는 모델은 음성 데이터 전체를 학습하기 위해 모델의 입력 크기를 길이가 가장 긴 음성 데이터의 크기에 맞추며 입력 크기보다 짧은 데이터는 0으로 덧붙인다. 0으로 덧붙일 시 여러 레이어를 거치더라도 0을 덧붙인 부분의 비율은 유지된다. 따라서 길이가 짧은 음성 신호를 입력할 경우 CNN, ...
Speech emotion recognition refers to recognizing speaker’s emotion using only speech signals. We propose a model combining CNN and LSTM after converting speech signals into Mel-Spectrogram for speech emotion recognition. Existing models learn only a specific section of entire speech signal. For trai...
저자 | 윤상혁 |
---|---|
학위수여기관 | 건국대학 대학원 |
학위구분 | 국내석사 |
학과 | 컴퓨터공학과 |
지도교수 | 박능수 |
발행연도 | 2022 |
총페이지 | 29 |
키워드 | Speech emotion recognition CNN LSTM Mel-Spectrogram Machine Learning |
언어 | kor |
원문 URL | http://www.riss.kr/link?id=T16082199&outLink=K |
정보원 | 한국교육학술정보원 |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.