주파수 분포벡터를 이용한 분류방법을 국악기 분류 및 인식에 적용하였으며 분류에 사용되는 주파수 분포 벡터 중에서 리듬성분을 수치화한 평균피크값을 제안하였다. 대부분의 주파수 처리함수들은 주파수값의 평균, 통계적특성에 기반을 두고 있으며 국악기자동분류를 위해 신호의 평균, 분산, 영교차율, 균형주파수, 평균 피크값을 이용하여 실험하였다. 국악의 장르 구분을 위한 선행 연구로서 음악신호를 함수처리하고 k-최근접이웃분류알고리즘을 적용하여 분류하였다. 기존의 주파수 분포벡터를 이용하여 발표되었던 서양음악의 분류 성공률 87%보다 향상된 94.44%의 성공률을 나타냈다.
주파수 분포벡터를 이용한 분류방법을 국악기 분류 및 인식에 적용하였으며 분류에 사용되는 주파수 분포 벡터 중에서 리듬성분을 수치화한 평균피크값을 제안하였다. 대부분의 주파수 처리함수들은 주파수값의 평균, 통계적특성에 기반을 두고 있으며 국악기자동분류를 위해 신호의 평균, 분산, 영교차율, 균형주파수, 평균 피크값을 이용하여 실험하였다. 국악의 장르 구분을 위한 선행 연구로서 음악신호를 함수처리하고 k-최근접이웃 분류알고리즘을 적용하여 분류하였다. 기존의 주파수 분포벡터를 이용하여 발표되었던 서양음악의 분류 성공률 87%보다 향상된 94.44%의 성공률을 나타냈다.
Classification method used in this paper is applied for the first time to Korean traditional music. Among the frequency distribution vectors, average peak value is suggested and proved effective comparing to previous classification success rate. Mean, variance, spectral centroid, average peak value ...
Classification method used in this paper is applied for the first time to Korean traditional music. Among the frequency distribution vectors, average peak value is suggested and proved effective comparing to previous classification success rate. Mean, variance, spectral centroid, average peak value and ZCR are used to classify Korean traditional musical instruments. To achieve Korean traditional instruments automatic classification, Spectral analysis is used. For the spectral domain, Various functions are introduced to extract features from the data files. k-NN classification algorithm is applied to experiments. Taegum, gayagum and violin are classified in accuracy of 94.44% which is higher than previous success rate 87%.
Classification method used in this paper is applied for the first time to Korean traditional music. Among the frequency distribution vectors, average peak value is suggested and proved effective comparing to previous classification success rate. Mean, variance, spectral centroid, average peak value and ZCR are used to classify Korean traditional musical instruments. To achieve Korean traditional instruments automatic classification, Spectral analysis is used. For the spectral domain, Various functions are introduced to extract features from the data files. k-NN classification algorithm is applied to experiments. Taegum, gayagum and violin are classified in accuracy of 94.44% which is higher than previous success rate 87%.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
국악기의 스펙트럼 분석을 통해 악기간 자동분류시스템을 구현하는 것이 최종 목적으로 이에 대한 선행 연구로서 가야금 독주의 주파수 분석을 통해 그 가능성을 확인하였다. 주파수 분류 방법을 이용한 분류기법은 서양 음악을 대상으로 실험되어 왔으며 국악을 대상으로 한 분류실험은 본 논문이 처음이다.
본 논문은 음악화일 분류기법 중 주파수 분포 벡터를 이용한 방법을 국악기분류에 적용하였으며 궁극적인 국악 장르 구분을 위한 선행 실험이다. 본 논문의 새로운 점은 주파수 분포벡터를 이용한 국악기 분류, 국악특성에 적합한 평균 피크값의 제안, k-근접 이웃 알고리즘을 적용하여 평균 피크값 및 k-최근접 이웃 알고리즘 유효성을 확인하였다.
이 시스템은 데이터의 인지적, 음향적 유사성을 이용하여 유사한 데이터를 분류할 수 있다. 본 논문은 음향 데이터 분류 그 중에서도 한국 전통 악기 분류에 초점을 맞추어 분류시스템을 구현하려고 한다.
본 실험은 녹음이 비교적 잘된데이터들을 이용하였으나 라디오, 공연장녹음등과같은 노이즈 간섭에 강한 분류시스템을 구축하는 것도 향후 과제이다. 이번 실험은 총체적인 국악기의판별 및 국악 장르의 분류를 목적으로 한 선행실험이며 그 가능성을 확인하였다.
제안 방법
DFT(Discrete Fourier Transform) 알고리즘을 사용하는 FFT에서 원신호와의 차이를 줄이기 위해 창함 수를 50% 중첩하였으며 256포인트의 FFT를 수행하여 충분한 해상도를 확보함으로서 원신호와의 유사성을 최대한 유지하고자 했다. 그림3는 주파수 분포밀도(Power Spectral Decsity; PSD)로서 FFT 변환된 주파수 성분을 자승 처리한 것이다.
예상과 같이 고음역의 악기인 피리의 중심주파수는 매우 높은 값을 보였다. 데이터 파일을 반복적으로 처리하여 평균, 분산, 영교 차율, 균형주파수, 평균피크값, 군의 분포벡터를 얻었다. 각 악기의 데이터는 30개이며 총 90개의 데이터를 반복적으로 실행하여 특성값을 구하였다.
바이올린은 대금보다도 연속적인 주파수 분포 특성이 강하며 주파수 에너지가 가야금, 대금보다 강함을 확인할 수 있다. 따라서 리듬의 빈도와 세기를 통합하여 수치화한 특성함수가 유용할 것으로 판단하고 평균 피크 값 특성함수를 고안하여 포함 시켰다.
물리적인 특성값으로는 에너지함수, 주파수 분포, 기본 주파수(fundamental fre quency) 등이 있으며 인지적인 특성값으로는 주관적인 요소로서 신호의 크기(loudness), 음고, 질감 (timbre), 리듬(rhythm)등이 있다. 본 논문에서는 물리적인 특성값인 영교차율, 균형주파수, 평균, 분산과 인지적인 특성값인 평균 피크값을 사용하여 기본적인 분류시스템을 구현하였다. 주파수 패턴이 복잡한 신호, 다양한 악기가 협연하는 협주곡의 경우엔해당 음악의 특성에 적합한 특성값을 도입하여 분류시스템의 성능을 높일 수 있다.
본 논문에서는 주파수 영역의 데이터를 이용하여시스템을 구성하였다. 시간 영역에서의 시스템 구현은 데이터별 녹음 크기가 다를 뿐 아니라 잡음에 큰간섭을 받게 되므로 강인한 시스템을 구현이 어렵다.
최근의 연구는 청각장분석 (auditory scene analysis) 분야와 음향심리학의새로운 분야로서 신호의 기저차원의 분석을 하는 주파수분포 패턴 분석이 행해지고 있다. 본 논문에서는청각장과 주파수 분포 분석을 이용하여 실험하였다.
국악 장르 구분을 위한 선행 실험이다. 본 논문의 새로운 점은 주파수 분포벡터를 이용한 국악기 분류, 국악특성에 적합한 평균 피크값의 제안, k-근접 이웃 알고리즘을 적용하여 평균 피크값 및 k-최근접 이웃 알고리즘 유효성을 확인하였다.
말한다. 본 분류시스템은 감독학습(supervised learning) 의일종으로 데이터의 군을 이용하여 학습한다.
평균 피크값은 리듬의 세기와 간격이 일정치 않은 국악의 특성을 수치화하기에 적합한 함수로서 분류 성공률 향상에 기여하였다. 본 연구에서는 국악기의 주파수 분포를 구하여 다양한 특성값을 추출한 후 분류알고리즘을 적용하여 악기들을 분류하였다. 이후의 연구 진행은 독주뿐 아니라 사물놀이, 영산회상과 같은 합주도 주파수 분석하여 장르 구분을 실험할 것이며 합주에는 다양한 악기가 포함되므로 위에 언급한 여러 가지 주파수 기법들을 포괄하여 주파수분석을 수행한다.
각각의 데이터샘플(wav file)은 15초 정도의 길이를 가지고 있으며 CD, MP3 파일로부터 추출하였다. 이를 FFT 분석하여 주파수스펙트럼을 구한 후 이를 바탕으로 특성값들을 구한다. 음악 신호의 FFT분석시에는 왜곡을 최소화 하기위해 표본 주파수를 충분히 크게 하였다.
본 연구에서는 국악기의 주파수 분포를 구하여 다양한 특성값을 추출한 후 분류알고리즘을 적용하여 악기들을 분류하였다. 이후의 연구 진행은 독주뿐 아니라 사물놀이, 영산회상과 같은 합주도 주파수 분석하여 장르 구분을 실험할 것이며 합주에는 다양한 악기가 포함되므로 위에 언급한 여러 가지 주파수 기법들을 포괄하여 주파수분석을 수행한다. 2장에서는 악기 신호처리의 기본이론을 소개하고 3장에서는 실험 결과 및 수식들을 기술하였다.
평균값이다. 일정한 임계값을 초과하는 신호는피크로 간주하고 피크의 빈도와 세기를 측정한다. 음압 또는 음량에 따른 악기의 특성을 수치화한다.
대상 데이터
데이터 파일을 반복적으로 처리하여 평균, 분산, 영교 차율, 균형주파수, 평균피크값, 군의 분포벡터를 얻었다. 각 악기의 데이터는 30개이며 총 90개의 데이터를 반복적으로 실행하여 특성값을 구하였다. 실험 순서는 표 1과 같다.
실험 순서는 표 1과 같다. 데이터로는 국악기인 대금, 가야금과 서양 악기인 바이올린의 표본을 사용하였다. 한 개의 표본마다 6개의 특성값을 추출하였다.
그래프의 밝기는 강도를 나타낸다. 모든 표본은 44100Hz로 샘플링 되었으며 선택된 음악들은 해당 장르를 대표할 만한 표준적인 연주를 선택했다. 그림 2(a)는 황병기연주의 가야금 독주이다.
그림 3에서 가야금은 가청주파수의 IKHz 이하에 에너지가 집중되어 있고 그림 4의 해금은 IKHz 이상의 주파수에 에너지가 집중하게 된다. 사용된 데이터는 44100Hz, 16bit 웨이브(wav) 파일이다. 이와 같이 음역대가 다른 악기들 간의 구분은 중심 주파수 값만으로도 충분히 해낼 수 있다.
이론/모형
음악 신호의 FFT분석시에는 왜곡을 최소화 하기위해 표본 주파수를 충분히 크게 하였다. FFT분석의안정성을 위해직각 창함수(rectangular window) 대신 창함수 양끝의 포락선이 완만한 헤 닝창함수 (Hanning window function)# 사용하였다.
분류대상과 가장 가까운 학습 데이터 셋의 k 계수를 구한다. 그리고 유클리디안 거리(Euclidean distance) 측정법을 사용하여 분류 대상과 학습 데이터의 거리를 구한다. 이러한 과정을 나머지 분류대상데이터에 대하여 반복한다.
한 개의 표본마다 6개의 특성값을 추출하였다. 데이터 사이의 벡터거리를 측정하여 분류하는 如최근접이웃분류 알고리즘을 적용하였다. 분류 시스템은 10분 교차 훈련법(ten-fold cross-validation)-®- 사용하여 하였다.
본 실험에서는 k-최근접이웃(^-Nearest Neighbor; k-NN) 분류알고리즘을 적용하여 분류하였다. 주어진 데이터 셋 伉, :%)을 이용하여 "게 대한 '의 값을예측한다.
데이터 사이의 벡터거리를 측정하여 분류하는 如최근접이웃분류 알고리즘을 적용하였다. 분류 시스템은 10분 교차 훈련법(ten-fold cross-validation)-®- 사용하여 하였다. 여기서 교차훈련 (cross - validation) 은 패턴인식에서 사용하는 일반적인 훈련기법으로 데이터 집합은 같은 크기의 n부분으로 나뉘어지고 (riT) 부분은, 분류시스템를학습시키 기 위해 사용한다.
전통적인 모델로서 골드슈타인 최적 처리기 (Goldstein optimum processor; Gldstein, 1973) 모델을 들 수있다. 신호의 주파수 성분의 고점이 추출되고 최우도처리기(maximum likelyhood processor; Therrien, 1989)를 이용하여 최적의 음고를 찾아낸다. 이 모델은 엄격한 수학적 바탕 위에 구현되었고 평가가 매우좋았다⑷.
성능/효과
90개의 데이터 중에서 85개의 데이터가 정확하게분류되었으며 실험의 분류 성공률은 94.44% 결과를얻었다. 잘못 분류된 5개의 데이터 중에서 4개는 대금을 가야금으로 분류한 경우이고 나머지 1개의 오류도 바이올린을 대금으로 분류한 것이다.
주파수 분류 방법을 이용한 분류기법은 서양 음악을 대상으로 실험되어 왔으며 국악을 대상으로 한 분류실험은 본 논문이 처음이다. 기존의 서양 음악 장르 분류 실험의 성공률은 87%로서 국악을 대상으로 한 본 실험의 성공률은 94.4%의 성공률을 나타내었다. 서양음악의 분류에 사용되었던 특성함수 외에 평균 피크값을 분류벡터에 포함하였다.
대금의 경우 연속적인 주파수 분포를 보여주며 리듬 패턴이 불규칙하다. 바이올린은 대금보다도 연속적인 주파수 분포 특성이 강하며 주파수 에너지가 가야금, 대금보다 강함을 확인할 수 있다. 따라서 리듬의 빈도와 세기를 통합하여 수치화한 특성함수가 유용할 것으로 판단하고 평균 피크 값 특성함수를 고안하여 포함 시켰다.
서양음악의 분류에 사용되었던 특성함수 외에 평균 피크값을 분류벡터에 포함하였다. 평균 피크값은 리듬의 세기와 간격이 일정치 않은 국악의 특성을 수치화하기에 적합한 함수로서 분류 성공률 향상에 기여하였다. 본 연구에서는 국악기의 주파수 분포를 구하여 다양한 특성값을 추출한 후 분류알고리즘을 적용하여 악기들을 분류하였다.
후속연구
가야금의 음향은 단속적인 특성을 가지고 있으며 바이올린과 대금은 일정 시간 음향이 지속되는 특성을 가짐으로서 바이올린과 대금에서 오류가 발생한 것으로 판단된다. 본 실험은 녹음이 비교적 잘된데이터들을 이용하였으나 라디오, 공연장녹음등과같은 노이즈 간섭에 강한 분류시스템을 구축하는 것도 향후 과제이다. 이번 실험은 총체적인 국악기의판별 및 국악 장르의 분류를 목적으로 한 선행실험이며 그 가능성을 확인하였다.
위 처리 함수들을 크게 두부류로 주파수 분포 밀도, 주파수의 실효값, 낮은 에너지 비와 균형주파수, 스펙트랄 플럭스, 영 교차율로 나눌 수 있다. 중심 주파수와 주파수 분포 밀도 함수만으로도 충분히 악기를 분류해 낼 수 있었으나 더욱 다양한 악기와 합주곡 분류를 위해선 더 많은 함수들이 필요할 것으로 판단된다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.