[논문]보컬 제거 알고리즘의 실시간 구현

김현태; 도진규; 박장식

보컬 제거 알고리즘의 실시간 구현
Real-Time Implementation for Vocal-Removal Algorithm 원문보기

김현태 (동의대학교) , 도진규 (동의대학교) , 박장식 (동의과학대학)

최근 고품질 원음 노래방기기에 대한 관심이 증가함에 따라, 기존 미디반주기 제조사들은 원음 레코딩 방법 대신 보다 저렴한 방법으로 원음 반주 음악을 만드는 방법을 시도하고 있다. 본 논문에서는 스테레오로 보컬 및 음악이 녹음된 AR(all recorded)에서 주파수 영역에서의 에너지 차 정보를 이용하여 MR(music recorded)을 만드는 방법과 DSP(TMS320C6713)를 이용하여 이를 실시간으로 구현하는 방법에 대해 연구하였다. DSP 보드의 출력단에 6채널 오디오출력 인터페이스를 설계하여 실시간으로 원음, 보컬이 제거된 MR, 그리고 분리된 보컬이 동시에 스테레오로 출력되도록 구현하였다. DSP를 이용한 청취 테스트를 통해 보컬의 분리 및 제거가 잘 이루어지는 것을 확인할 수 있다.

Recently, According to increasing interest to original sound Karaoke instrument, MIDI type karaoke manufacturer attempt to make more cheap method instead of original recoding method. In this paper, we developed how to create MR from AR, recorded in stereo, by using the energy difference in the frequency domain and how to implement in DSP(TMS320C6713) were developed. At the output of the DSP board, 6-channel audio output interface designed for real-time stereophonic generating original sound, vocals removed MR, and separated vocals simultaneously. Real-time listening test using DSP show vocal separating and removal task successfully.

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

가설 설정

AR(all recorded)된 스테레오 음악에는 왼쪽채널과 오른쪽채널에 각각 보컬의 소리가 똑같이 들어가 있다는 가정과 주파수 영역에서 MR (music recorded)의 경우는 80 ~ 400Hz사이에 분포하게 되며 보컬의 음높이는 소프라노 (soprano)와 같은 경우 1400Hz까지 높게 발생하므로 MR과 보컬은 음높이의 차이점을 이용하여 보컬을 제거한다.

제안 방법

AR로부터 보컬을 제거하는 알고리즘을 DSP 보드 상에 구현하고 6개 채널의 오디오 출력인터페이스를 연결하여 AR, MR 및 분리된 보컬을 각각 스테레오로 동시에 실시간으로 출력하도록 구성하였다. 또한 DSP의 결과를 이용하여 다양한 장르 및 곡을 대상으로 연구에 참여한 연구원 3명을 대상으로 청취테스트를 실시하고 그 결과를 표 2에 나타내었다.
완성된 코드를 DSP(digital signal processing) TMS320C6713 DSK 보드에 다운로드시켜 구현하였다. 보드의 오디오 출력단에 6개 채널 오디오 인터페이스를 설계하여 2개 채널에는 스테레오 AR, 또 다른 2개 채널에는 보컬 제거한 MR, 나머지 2개 채널에서는 분리된 보컬이 실시간으로 거의 동시에 출력되도록 설계하였다. 그림 2에 구현한 보컬 제거기를 나타내었다.
본 논문에서 스테레오(streo)로 녹음된 AR로부터 주파수 영역에서 개별 스테레오 신호와 스테레오 채널간 차신호간의 주파수 빈별 에너지 비교를 통해 보컬의 유무를 판별하여 분리하고 DSP 보드를 통해 실시간으로 구현한다.
완성된 코드를 DSP(digital signal processing) TMS320C6713 DSK 보드에 다운로드시켜 구현하였다. 보드의 오디오 출력단에 6개 채널 오디오 인터페이스를 설계하여 2개 채널에는 스테레오 AR, 또 다른 2개 채널에는 보컬 제거한 MR, 나머지 2개 채널에서는 분리된 보컬이 실시간으로 거의 동시에 출력되도록 설계하였다.
제안하는 보컬 제거 알고리즘을 CCS(code composer studio) DSK v3.1을 이용하여 코드를 완성하였으며, 완성된 코드 중 주파수 빈별 보컬 여부를 판별하는 부분을 발췌하여 표 1에 나타내었다.

성능/효과

또한 DSP의 결과를 이용하여 다양한 장르 및 곡을 대상으로 연구에 참여한 연구원 3명을 대상으로 청취테스트를 실시하고 그 결과를 표 2에 나타내었다. 청취테스트 결과 보컬 제거한 MR의 음질에 대한 평가에서 약 83%정도 우수한 평가를 얻었다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

보컬 제거 알고리즘의 실시간 구현
Real-Time Implementation for Vocal-Removal Algorithm 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

AI 본문요약
AI-Helper

가설 설정

제안 방법

성능/효과

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

보컬 제거 알고리즘의 실시간 구현 Real-Time Implementation for Vocal-Removal Algorithm 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

AI 본문요약 엑셀 다운로드 AI-Helper

가설 설정

제안 방법

성능/효과

이 논문을 인용한 문헌

관련 콘텐츠

원문 보기

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

보컬 제거 알고리즘의 실시간 구현
Real-Time Implementation for Vocal-Removal Algorithm 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper