$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색도움말
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"

통합검색

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

논문 상세정보

음성감정인식에서 음색 특성 및 영향 분석

Analysis of Voice Quality Features and Their Contribution to Emotion Recognition

초록
용어

논문에서 용어와 풀이말을 자동 추출한 결과로,
시범 서비스 중입니다.

본 연구는 감정상태와 음색특성의 관계를 확인하고, 추가로 cepstral 피쳐와 조합하여 감정인식을 진행하였다. Open quotient, harmonic-to-noise ratio, spectral tilt, spectral sharpness를 포함하는 특징들을 음색검출을 위해 적용하였고, 일반적으로 사용되는 피치와 에너지를 기반한 운율피쳐를 적용하였다. ANOVA분석을 통해 각 특징벡터의 유효성을 살펴보고, sequential forward selection 방법을 적용하여 최종 감정인식 성능을 분석하였다. 결과적으로, 제안된 피쳐들으로부터 성능이 향상되는 것을 확인하였고, 특히 화남과 기쁨에 대하여 에러가 줄어드는 것을 확인하였다. 또한 음색관련 피쳐들이 cepstral 피쳐와 결합할 경우 역시 인식 성능이 향상되었다.

Abstract

This study investigates the relationship between voice quality measurements and emotional states, in addition to conventional prosodic and cepstral features. Open quotient, harmonics-to-noise ratio, spectral tilt, spectral sharpness, and band energy were analyzed as voice quality features, and prosodic features related to fundamental frequency and energy are also examined. ANOVA tests and Sequential Forward Selection are used to evaluate significance and verify performance. Classification experiments show that using the proposed features increases overall accuracy, and in particular, errors between happy and angry decrease. Results also show that adding voice quality features to conventional cepstral features leads to increase in performance.

본문요약 

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의
  • This letter aims to expand upon analyses of the relationship between voice quality measurements and emotions.

    This letter aims to expand upon analyses of the relationship between voice quality measurements and emotions. There are three main objectives of this study.

  • This study focused on the importance of the voice quality to overcome limitations of prosodic features.

    The features used in previous studies are insufficient to classify the valence of emotions, though activation of emotion is easily classified. This study focused on the importance of the voice quality to overcome limitations of prosodic features.

  • This study presents an investigation of the relationship between voice quality and emotions, and useful feature measurements.

    This study presents an investigation of the relationship between voice quality and emotions, and useful feature measurements. For voice quality features, open quotient, harmonics-to-noise ratio, spectral tilt, spectral sharpness, and band energy features are considered.

본문요약 정보가 도움이 되었나요?

참고문헌 (8)

  1. 1. R. Cowie, E. Douglas-Cowei, N. Tsapatsoulis, G. Votsis, S. Kollias, W. Fellenz, and J. G. Taylor, "Emotion Recognition in Human Computer Interaction," IEEE Signal Processing Magazine, pp. 32-80, 2001. 
  2. 2. B.-S. Kang, "Text independent emotion recognition using speech signals," M. S. Thesis, Yonsei university, 2000. 
  3. 3. I. Murray, J. Arnott, "Toward the simulation of emotion in synthetic speech: A review of the literature of human vocal emotion," J. Acoust. Soc. Am, vol. 93 (2), pp. 1097-1108, 1993. 
  4. 4. H.-S. Kwak, S.-H. Kim, Y.-K. Kwak, "Emotion recognition using prosodic feature vector and Gaussian mixture model," Korean Soc. for Noise and Vibration Eng, pp. 762-765, 2002. 
  5. 5. S. Yacoub, S. Simske, X. Lin, J. Burns, "Recognition of Emotionsin Interactive Voice Response System," Proceedings of the Eurospeech 2003, Geneva, 2003. 
  6. 6. J.-Y. Choi, M. Hasegawa-Johnson, J. Cole, "Finding intonational boundaries using acoustic cues related to the voice source," J. Acout. Soc. Am. vol. 118 (4), p. 2579-2587, 2005. 
  7. 7. G. de Krom, "A Cepstrum-based technique for determining a Harmonic-to-Noise ratio in speech signals," J. Speech Hearing Res. vol. 36, pp. 254-266, 1993. 
  8. 8. P. Pudil, F. J. Ferri, J. Novovicova, J. Kittler, "Floating Search Methods for Feature Selection with Nonmonotonic Criterion Functions," Proceedings of the IEEE International Conference on Pattern Recognition, vol. 2, pp. 279-283, Jerusalem, 1994. 

문의하기 

궁금한 사항이나 기타 의견이 있으시면 남겨주세요.

Q&A 등록

원문보기

원문 PDF 다운로드

  • ScienceON :
  • AccessON :

원문 URL 링크

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

오픈액세스(OA) 유형

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

DOI 인용 스타일

"" 핵심어 질의응답