최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국음향학회지= The journal of the acoustical society of Korea, v.35 no.1, 2016년, pp.49 - 54
조혜승 (광운대학교 전파공학과) , 김형국 (광운대학교 전파공학과)
In this paper, we propose a vocal separation method using weighted
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
KAM은 무엇인가? | KAM은 음악 신호가 일정한 주기를 가진 다수의 퍼커시브 음원, 하모닉 음원, 보컬 음원의 합으로 구성된다는 가정 하에 각각의 음원을 개별적으로 추정하는 방식으로, 반복적 백피팅(back-fitting) 알고리즘을 적용하여 각 음원의 스펙트럼을 재추정하여 갱신한다. 또한 음원 분리 단계에서 위너 필터(Wiener filter) 방식을 적용하여 추정한 음원을 분리한다. | |
배경음과 보컬음을 추정한 후 이를 기반으로 각 음원을 분리하는 연구는 어떤 원리의 기본에의해 진행되어 왔는가? | 기본적으로 음악 신호의 배경음과 보컬음의 분리는 음원의 추정과 추정된 음원에 대한 분리 기술의 적용으로 수행된다. 이에 따라 NMF(Non-negative Matrix Factorization),[1] REPET(Repeating Pattern Extraction Technique)[2] 등 다양한 접근 방식을 통해 배경음과 보컬음을 추정한 후 이를 기반으로 각 음원을 분리하는 연구가 진행되었으며 최근에는 KAM(Kernel Additive Modeling)[3]을 적용한 음원 분리 방식이 제안되었다. | |
베이지안(Bayesian) 최소평균제곱오차 추정방식의 장점은? | 일반적으로 음성향상 알고리즘에서 사용되는 베이지안(Bayesian) 최소평균제곱오차(Minimum Mean Square Error: MMSE) 추정방식[4]은 음성 추정에 있어서 기존의 위너 필터 방식의 성능보다 우수하고, 가중β-지수승 MMSE 추정방식(Weighted β-order MMSE Estimation: WbE)[4]은 일반적인 베이지안 MMSE 추정방식에 지수 파라미터를 적용하여 사람의 청각적 지각 특성을 반영한 것으로 기존의 베이지안 MMSE 추정방식 기반의 다양한 음성 추정 방식 중 가장 우수한 성능을 제공하는 것으로 널리 알려져 있다. |
S. Vembu and S. Baumann "Separation of vocals from polyphonic audio recordings," in Proc. International Society for Music Information Retrieval Conference, 337-344 (2005).
Z. Rafii and B. Pardo, "Repeating pattern extraction technique (REPET): a simple method for music/voice separation," IEEE Trans. Audio, Speech, Language Process. 21, 71-82 (2013).
A. Liutkus, D. Fitzgerald, Z. Raffi, B. Pardo, and L. Daudet, "Kernel additive models for source separation," IEEE Trans. Signal Process. 62, 4298-4310 (2014).
E. Plourde and B. Champagne, "Auditory-based spectral amplitude estimators for speech enhancement," IEEE Trans. Audio, Speech, Language Process. 16, 1614-1623 (2008).
F. Deng, F. Bao, and C.-C. Bao, "Speech enhancement using generalized ${\beta}$ -order spectral amplitude estimator," Speech Commun. 59, 55-68 (2014).
E.Vincent, R. Griboncal, and C. Fevotte, "Performance measurement in blind audio source separation," IEEE Trans. Audio, Speech, Language Process. 14, 1462-1469 (2006).
A. Liutkus, D. Fitzgerald, and Z. Rafii, "Scalable audio separation with light kernel additive modeling," in Proc. IEEE International Conference on Acoustics, Speech and Signal Processing, 76-80 (2015).
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.