$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

SVM과 선택적 주파수 차감법을 이용한 음악에서의 보컬 분리
Vocal Separation in Music Using SVM and Selective Frequency Subtraction 원문보기

한국전자통신학회 논문지 = The Journal of the Korea Institute of Electronic Communication Sciences, v.10 no.1, 2015년, pp.1 - 6  

김현태 (동의대학교 멀티미디어공학과)

초록
AI-Helper 아이콘AI-Helper

최근 원음 반주기에 대한 관심이 증가됨에 따라 고가의 스튜디오 직접 녹음 방법 대신 보다 저렴한 방법을 시도하고 있다. 그 구체적인 방법으로는 가수의 음악 앨범에서 가수의 목소리만 제거하여 원음 반주 음원을 만드는 것이다. 본 논문에서는 스테레오로 녹음된 반주음악에서 보컬을 분리하는 시스템을 제안한다. 제안하는 시스템은 두 단계로 구성된다. 첫 단계는 보컬을 검출하는 단계이다. 이 단계에서는 MFCC를 가지고 SVM 방법을 이용하여 입력 신호를 보컬 부분과 비보컬 부분으로 분리한다. 두 번째 단계에서는 보컬 부분에 대해 각 주파수 빈별로 선택적 주파수 차감을 수행한다. 제안하는 방법으로 보컬을 제거한 음악에 대한 청취실험에서 상대적으로 높은 만족도를 보여준다.

Abstract AI-Helper 아이콘AI-Helper

Recently, According to increasing interest to original sound Karaoke instrument, MIDI type karaoke manufacturer attempt to make more cheap method instead of original recoding method. The specific method is to make the original sound accompaniment to remove only the voice of the singer in the singer ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 인간의 청각 특성을 고려한 MFCC (Mel-Frequency Cepstral Coefficients) 관련 특징 값 들에 대한 보컬 영역과 비보컬 영역의 차이를 SVM(Support Vector Machine) 방법을 통해 훈련하고 판별하는 보컬 검출 부분과 스테레오 음악 신호에서 보컬의 음상이 주로 센터에 위치한다는 사실에 기반한 주파수빈별 에너지 차감법을 적용한 보컬 분리 방법을 제안하였다. 보컬 검출 성능은 직접 청취하여 세그먼트별 판별한 내용과 비교한 결과 76.
  • 본 논문에서는 인간의 청각 특성을 고려한 MFCC (Mel-Frequency Cepstral Coefficients) 관련 특징 값들에 대한 보컬 영역과 비보컬 영역의 차이를 SVM (Support Vector Machine) 방법을 통해 훈련하고 판별하는 보컬 검출 부분과 스테레오 음악 신호에서 보컬의 음상이 주로 센터에 위치한다는 사실에 기반한 주파수빈별 에너지 차감법을 적용한 보컬 분리방법을 제안한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
전통적인 통계적인 접근법에는 어떤 것들이 있는가? 보컬이 포함된 노래에서 목소리 영역을 찾는 문제는 음성 특징으로 널리 사용되어진 전통적인 통계적인 접근법이 적용되어져 왔다. 예를 들면, GMM(Gaussian Mixture Model)[3-5], 신경망, 그리고 SVM 또는 HMM(Hidden Markov Model)이 사용되어져 왔다[6-7]
스테레오로 녹음된 반주음악에서 보컬을 분리하는 시스템은 어떻게 구성되는가? 제안하는 시스템은 두 단계로 구성된다. 첫 단계는 보컬을 검출하는 단계이다. 이 단계에서는 MFCC를 가지고 SVM 방법을 이용하여 입력 신호를 보컬 부분과 비보컬 부분으로 분리한다. 두 번째 단계에서는 보컬 부분에 대해 각 주파수 빈별로 선택적 주파수 차감을 수행한다. 제안하는 방법으로 보컬을 제거한 음악에 대한 청취실험에서 상대적으로 높은 만족도를 보여준다.
저비용으로 원음 반주음악을 제작하는 방법이 요구되고 있는 이유는 무엇인가? 최근 원음노래반주기 수요가 증가함에 따라 노래반주기 시장에 미디기반 노래반주기 대신 원음노래반주기가 보급되고 있다. 그러나 원음 노래 반주음악을 제작하는 데 많은 비용이 소요되는 문제로 보급이 지연 되고 있어 보다 저비용으로 원음 반주음악을 제작하는 방법이 요구되고 있다. 그 중 한 방법으로 제시되는 것은 가수의 원음 음반에서 가수의 보컬만 제거하여 원음 반주음악으로 사용하는 것이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (10)

  1. W. Tsai and H. Wang, "Automatic singer recognition of popular music recordings via estimation and modeling of solo vocal signals," IEEE Trans. Audio, Speech, and Language Processing, vol. 14, issue 1, 2006, pp. 330-341. 

  2. S. Vembu and S. Baumann, "Separation of vocals from polyphonic audio recordings," In Proc. Int. Society for Music Information Retrieval, London, UK, Sept., 2005. 

  3. H. Kim, G. Lee, J. park, and Y. Yu, "Vehicle Detection in Tunnel using Gaussian Mixture Model and Mathematical Morphological Processing," J. of the Korea Institute of Electronic Communication Science, vol. 7, no. 5, 2012, pp. 967-974. 

  4. K. Park and H. Kim, "A Study for Video-based Vehicle Surveillance on Outdoor Road," J. of the Korea Institute of Electronic Communication Science, vol. 8, no. 11, 2013, pp. 1647-1653. 

  5. H. Kim and J. Park, "Smoke Detection in Outdoor Using Its Statistical Characteristics," J. of the Korea Institute of Electronic Communication Science, vol. 9, no. 2, 2014, pp. 149-154. 

  6. T. Leung, C. Ngo, and R. W. H. Lau, "Ica-fx features for classification of singing voice and instrumental sound," In Proc. Int. Conf. on Pattern Recognition, Cambridge, UK, vol. 2, Aug. 2004. 

  7. A. Berenzweig and D. P. W. Ellis, "Locating singing voice segments within music signals," In Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPAA' 2001), New York, NY, Oct. 2001. 

  8. T. Virtanen, A. Mesaros, and M. Ryynanen, "Combining Pitch-Based Inference and Non-Negative Spectrogram Factorization in Separating Vocals from Polyphonic Music," In Proc. Statistical and Perceptual Audition, Brisbane, Australia, Sept. 2008. 

  9. J.-L. Durrieu, A. Ozerov, C. Fevotte, G. Richard, and B. David, "Main instrument separation from stereophonic audio signals using a source/filter model," 17th European Signal Processing Conf. (EUSIPCO 2009) Glasgow, Scotland, Aug. 2009. 

  10. H. Park and K. Lee, "Pattern and Machine Learning from Fundamental to Applications, Goyang, Korea : Ihan Press, 2011. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로