$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

커널 스펙트럼 모델 backfitting 기반의 로그 스펙트럼 진폭 추정을 적용한 배경음과 보컬음 분리
Music and Voice Separation Using Log-Spectral Amplitude Estimator Based on Kernel Spectrogram Models Backfitting 원문보기

한국음향학회지= The journal of the acoustical society of Korea, v.34 no.3, 2015년, pp.227 - 233  

이준용 (광운대학교 전파공학과) ,  김형국 (광운대학교 전파공학과)

초록
AI-Helper 아이콘AI-Helper

본 논문은 커널 스펙트럼 모델 backfitting 기반의 로그 스펙트럼 진폭 추정부를 적용한 배경음과 보컬음 분리를 제안한다. 기존의 커널 스펙트럼 모델 기반의 배경음과 보컬음 분리는 추출하고자하는 객체의 모델을 기반으로 위너형태의 평균 제곱의 오차의 이득값을 학습함으로써 배경음과 보컬음을 분리하는 기술이다. 본 논문은 기존의 커널 스펙트럴 모델 기반의 배경음과 보컬음 분리 방식에서 위너형태의 이득값 대신 로그 스펙트럼 진폭 추정을 적용하여 기존 방식 보다 명료한 배경음과 보컬음을 추출한다. 실험결과는 본 논문에서 제안한 방식이 기존의 방식들보다 더 우수하다는 것을 보인다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we propose music and voice separation using kernel sptectrogram models backfitting based on log-spectral amplitude estimator. The existing method separates sources based on the estimate of a desired objects by training MSE (Mean Square Error) designed Winer filter. We introduce rather...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문은 커널 스펙트럼 모델 backfitting 기반의 로그 스펙트럼 진폭 추정을적용한 배경음과 보컬음 분리를 제안하였다. 실험결과 커널 스펙트럼 모델 기반의 배경음과 보컬음 분리 방식이 REPET 방식보다 더 명료한 보컬음을 추출한다는 것을 확인했으며 특히, 논문에서 제안한 방식이 배경음과 보컬음 모두 기존의 REPET 방식, 위너형태의 커널 모델 기반 분리 기법보다 레퍼런스 신호에 더 유사하게 분리된다는 것을 확인했다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
Rafii와 Pardo[4]의 반복적인 배경음에 대한 배경음, 보컬음 분리기술(REPET)의 문제점은 무엇인가? Rafii와 Pardo[4]의 반복적인 배경음에 대한 배경음, 보컬음 분리기술(REPET)은 배경음이 반복적인 특성을 갖는 점을 이용하여 반복적인 배경음과 보컬음을 추출하는 방식이다. 하지만 이 방식은 강한 에너지를 갖는 주기만을 검출하기에 그 외의 반복적인 주기를 잘 검출하지 못한다는 문제점과 추출된 배경 음을 원음에서 차감하는 식으로 보컬음을 추출하기에 명료한 배경음이 추출되지 않을 경우 보컬음에도 배경음이 묻어나온다는 문제가 있다.
커널 스펙트럼 모델 피팅부는 무엇인가? 커널 스펙트럼 모델 피팅부는 추정하고자 하는 객체의 모델을 생성해서 입력된 스펙트럼을 생성된 모델 형태에 맞게 스펙트럼을 변환해 주는 과정으로 커널 스펙트럼 모델 생성부와 모델 피팅부 2가지로 구성되어있다.
음원 분리 기술은 어떤 방식들을 이용하여 연구가 진행되고 있는가? 음원 분리 기술은 혼합된 오디오 신호에 대해 배경음과 보컬음을 분리하는 기술로써 지난 30년간 꾸준히 연구되고 있으며 텔레커뮤니케이션, 오디오 신호 처리, 은닉 성분 분석, 생체 신호처리, 입체음향 재현 등 다양하게 적용되고 있다. 음원 분리 기술은 ICA (Independent Components Analysis),[1] RPCA(Robust Principal Component Analysis),[2] NMF(Non-negative Matrix Factorization)[3] 등 여러 가지 방식을 이용하여 음원을 보컬음과 배경음의 객체로 분리하는 연구로 진행되고 있는데 그 중 Rafii와 Pardo[4]의 REPET 방식과 Liutkus et al.[5]의 커널 스펙트럼 모델기반의 음원분리기술이 가장 대표적이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (9)

  1. P. Comon and C. Jutten, Handbook of Blind Source Separation: Independent Component Analysis and Applications (Academic Press, 2010). pp. 208-214. 

  2. P.-S. Huang, S. D. Chen, P. Smaragdis, and M. H. Johnson, "Singing-voice separation from monaural recordings using robust principal component analysis," in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 57-60 (2012). 

  3. A. Ozerov, E. Vincent, and F. Bimbot, "A general flexible framework for the handling of prior information in audio source separation," Audio, Speech, and Language Processing, IEEE Transactions on, 1118-1133 (2011) 

  4. Z. Rafii and B. Pardo, "Repeating pattern extraction technique (REPET): A simple method for music/voice separation," IEEE Transactions on Audio, Speech & Language Processing, 71-82 (2013). 

  5. A. Liutkus, Z. Rafii, E. Fitzgerald and L. Daudet, "Kernel spectrogram models for source separation," 4th Joint Workshop on Hands-free Speech Communication Microphone Arrays, (2014). 

  6. Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator," IEEE Trans. Acoust. Speech Signal Process, 443-445 (1985). 

  7. B. J. Shannon and K. K. Paliwal, "Role of phase estimation in speech enhancement," in Proc. 9th Int. Conf. Spoken Language Processing - Interspeech, Pittsburgh, PA, 1423-1426 (2006). 

  8. Y. Ephraim and I. Cohen, "Recent advancements in speech enhancement," in the Electrical Engineering Handbook, (CRC press, 2005). 

  9. E. Vincent, R. Gribonval, and M. Plumbley, "Oracle estimators for the benchmarking of source separation algorithms," Signal Processing, 1933-1950, (2007). 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로