최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국음향학회지= The journal of the acoustical society of Korea, v.34 no.3, 2015년, pp.227 - 233
이준용 (광운대학교 전파공학과) , 김형국 (광운대학교 전파공학과)
In this paper, we propose music and voice separation using kernel sptectrogram models backfitting based on log-spectral amplitude estimator. The existing method separates sources based on the estimate of a desired objects by training MSE (Mean Square Error) designed Winer filter. We introduce rather...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
Rafii와 Pardo[4]의 반복적인 배경음에 대한 배경음, 보컬음 분리기술(REPET)의 문제점은 무엇인가? | Rafii와 Pardo[4]의 반복적인 배경음에 대한 배경음, 보컬음 분리기술(REPET)은 배경음이 반복적인 특성을 갖는 점을 이용하여 반복적인 배경음과 보컬음을 추출하는 방식이다. 하지만 이 방식은 강한 에너지를 갖는 주기만을 검출하기에 그 외의 반복적인 주기를 잘 검출하지 못한다는 문제점과 추출된 배경 음을 원음에서 차감하는 식으로 보컬음을 추출하기에 명료한 배경음이 추출되지 않을 경우 보컬음에도 배경음이 묻어나온다는 문제가 있다. | |
커널 스펙트럼 모델 피팅부는 무엇인가? | 커널 스펙트럼 모델 피팅부는 추정하고자 하는 객체의 모델을 생성해서 입력된 스펙트럼을 생성된 모델 형태에 맞게 스펙트럼을 변환해 주는 과정으로 커널 스펙트럼 모델 생성부와 모델 피팅부 2가지로 구성되어있다. | |
음원 분리 기술은 어떤 방식들을 이용하여 연구가 진행되고 있는가? | 음원 분리 기술은 혼합된 오디오 신호에 대해 배경음과 보컬음을 분리하는 기술로써 지난 30년간 꾸준히 연구되고 있으며 텔레커뮤니케이션, 오디오 신호 처리, 은닉 성분 분석, 생체 신호처리, 입체음향 재현 등 다양하게 적용되고 있다. 음원 분리 기술은 ICA (Independent Components Analysis),[1] RPCA(Robust Principal Component Analysis),[2] NMF(Non-negative Matrix Factorization)[3] 등 여러 가지 방식을 이용하여 음원을 보컬음과 배경음의 객체로 분리하는 연구로 진행되고 있는데 그 중 Rafii와 Pardo[4]의 REPET 방식과 Liutkus et al.[5]의 커널 스펙트럼 모델기반의 음원분리기술이 가장 대표적이다. |
P. Comon and C. Jutten, Handbook of Blind Source Separation: Independent Component Analysis and Applications (Academic Press, 2010). pp. 208-214.
P.-S. Huang, S. D. Chen, P. Smaragdis, and M. H. Johnson, "Singing-voice separation from monaural recordings using robust principal component analysis," in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 57-60 (2012).
A. Ozerov, E. Vincent, and F. Bimbot, "A general flexible framework for the handling of prior information in audio source separation," Audio, Speech, and Language Processing, IEEE Transactions on, 1118-1133 (2011)
Z. Rafii and B. Pardo, "Repeating pattern extraction technique (REPET): A simple method for music/voice separation," IEEE Transactions on Audio, Speech & Language Processing, 71-82 (2013).
A. Liutkus, Z. Rafii, E. Fitzgerald and L. Daudet, "Kernel spectrogram models for source separation," 4th Joint Workshop on Hands-free Speech Communication Microphone Arrays, (2014).
Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error log-spectral amplitude estimator," IEEE Trans. Acoust. Speech Signal Process, 443-445 (1985).
B. J. Shannon and K. K. Paliwal, "Role of phase estimation in speech enhancement," in Proc. 9th Int. Conf. Spoken Language Processing - Interspeech, Pittsburgh, PA, 1423-1426 (2006).
Y. Ephraim and I. Cohen, "Recent advancements in speech enhancement," in the Electrical Engineering Handbook, (CRC press, 2005).
E. Vincent, R. Gribonval, and M. Plumbley, "Oracle estimators for the benchmarking of source separation algorithms," Signal Processing, 1933-1950, (2007).
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.