$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"

논문 상세정보

초록

본 논문에서는 음악 장르 분류를 위한 새로운 자동 Taxonomy 구축 알고리즘을 제안한다. 제안된 알고리즘은 모든 가능한 노드들의 분류 확률을 예측하여 예측된 분류 성능값이 가장 좋은 조합을 Taxonomy로 구축하는 것이다. 제안된 알고리즘에서의 분류 확률 예측은 훈련 데이터를 k-fold cross validation을 이용하여 분류기에 적용함으로써 이루어진다. 제안된 알고리즘을 기반으로 한 분류 성능 측정은 2 클래스로 이루어진 각각의 노드에 2개 범주 분류에 효과적인 support vector machine을 적용함으로써 이루어진다. 제안된 알고리즘의 성능 검증을 위해 음색, 리듬, 피치 등 오디오 신호의 특징을 나타내는 다양한 파라미터를 오디오 신호로부터 추출하여 제안된 알고리즘과 기존의 다중 범주 분류기들을 이용하여 분류성능을 평가하였다. 다양한 실험결과 제안된 알고리즘은 기존의 알고리즘에 비하여 5%에서 25%정도의 분류 성능이 향상된 것을 확인할 수 있었고 특히 낮은 차원의 특징벡터를 이용한 분류 실험에서는 10% 에서 25% 향상된 좋은 성능을 보였다.

Abstract

In this paper, we propose a new automatic taxonomy generation algorithm for the audio genre classification. The proposed algorithm automatically generates hierarchical taxonomy based on the estimated classification accuracy at all possible nodes. The estimation of classification accuracy in the proposed algorithm is conducted by applying the training data to classifier using k-fold cross validation. Subsequent classification accuracy is then to be tested at every node which consists of two clusters by applying one-versus-one support vector machine. In order to assess the performance of the proposed algorithm, we extracted various features which represent characteristics such as timbre, rhythm, pitch and so on. Then, we investigated classification performance using the proposed algorithm and previous flat classifiers. The classification accuracy reaches to 89 percent with proposed scheme, which is 5 to 25 percent higher than the previous flat classification methods. Using low-dimensional feature vectors, in particular, it is 10 to 25 percent higher than previous algorithms for classification experiments.

본문요약 

문제 정의
  • 본 논문에서는 계층적인 오디오 장르에 따른 오디오신호의 자동 분류 시스템을 제안하였다.

    본 논문에서는 계층적인 오디오 장르에 따른 오디오신호의 자동 분류 시스템을 제안하였다. 제안된 알고리즘은 모든 가능한 노드들의 분류 확률을 예측하여 예측된분류 성능값이 가장 좋은 조합을 Taxonomy로 구축하는것이다.

  • 본 논문에서는 오디오 장르의 계층구조를 만들 때 모든 가능한 장르 쌍들의 분류 확률 예측을 기반으로 자동으로 구축하는 알고리즘을 제안하고 이를 분석한다.

    본 논문에서는 오디오 장르의 계층구조를 만들 때 모든 가능한 장르 쌍들의 분류 확률 예측을 기반으로 자동으로 구축하는 알고리즘을 제안하고 이를 분석한다.

  • 본 논문에서는 이러한 단점들을 극복하기 위하여 새로운 taxonomy 구축방법을 제안하였다 제안된 알고리즘은 오디오 장르의 계층구조를 만들 때 모든 가능한 장르쌍들의 분류 확률 예측을 기반으로 자동으로 구축하여 자동분류 시스템의 분류 성능을 높인다.

    본 논문에서는 이러한 단점들을 극복하기 위하여 새로운 taxonomy 구축방법을 제안하였다 제안된 알고리즘은 오디오 장르의 계층구조를 만들 때 모든 가능한 장르쌍들의 분류 확률 예측을 기반으로 자동으로 구축하여 자동분류 시스템의 분류 성능을 높인다. 분류 확률 예측을 위해 모든 가능한 클러스터 쌍들을 나누어 놓고 wrapper algorithm [1 이을 이용하여 각각의 클러스터 쌍들을 가장잘 분리할 수 있는 특징벡터를 추출한다.

  • 본 연구의 목표는 주어진 특징 벡터들을 사용하여 최상의 분류 성능을 가지는 taxonomy를 자동으로 구축하는것이다.

    본 연구의 목표는 주어진 특징 벡터들을 사용하여 최상의 분류 성능을 가지는 taxonomy를 자동으로 구축하는것이다. 핵심적인 아이디어는 분류 성능을 예측하여 장르들간의 관계를 추론하는 것이다.

본문요약 정보가 도움이 되었나요?

참고문헌 (20)

  1. 1. L. Lu and H. Zhang, "Content analysis for audio classification and segmentation," IEEE Trans. on Speech and Audio Process., 10(5), 504-516, Sep. 2002 
  2. 2. G. Tzanetakis and P. Cook, "Musical Genre Classification of audio signals", IEEE Trans. on Speech and Audio Process., 10(4), 293-302, July 2002 
  3. 3. C. Yang, Database retrieval based on spectral similarity, (Stanford Univ. Database Group, Stanford, CA, Tech, Rep. 2001-14, 2001) 
  4. 4. Tao Li and Mitsunori Ogihara, "Music genre classification with taxonomy," Proc. Int. Conf. Acoustics, Speech, Signal Processing (ICASSP), 197-200, 2005 
  5. 5. Juan Jose Burred and Alexander Lerch, "A hierarchical approach to automatic musical genre classification," Proc. of the 6th Int. Conference on Digital Audio Effects (DAFX-03), London, UK, Sept. 8-11, 2003 
  6. 6. E. Scheirer and M. Slaney, "Construction and evaluation of a robust multifeature speech/music discriminator," Proc. Int. Conf. Acoustics, Speech, Signal Processing (ICASSP), 1331-1334, 1997 
  7. 7. Beth Logan, "Mel Frequency Cepstral Coefficients for music modeling," in Proc. of the First International Symposium on Music Information Retrieval (ISMIR), 2000 
  8. 8. S.Essid, G.Richard, and B.David, "Instrument Recognition in Polyphonic Music Based on Automatic taxonomies," IEEE Trans. Audio, Speech, and Lang. Process., 14(1), 68-80, Jan. 2006 
  9. 9. G. Peeters, "A large set of audio fetures for sound description (similarity and classification) in the CUIDADO project," CUIDADO I.S.T. Project Report, 2004 
  10. 10. D.-N. Jiang, L. Lu, H.-J. Zhang, J.-H. Tao, and L.-H. Cai, "Music type classification by spectral contrast feature,"Proc. of IEEE Int. Conf. on Multimedia and Expo (ICME02), Lausanne Switzerland, Aug, 2002 
  11. 11. S. Essid, G. Richard and B. David, "Musical instrument recognition based on class pairwise feature selection," Proc. 5th Int. Conf. Music Information Retrieval (ISMIR), Barcelona, Spain, Oct. 2004 
  12. 12. T. Tolenen and M. Karjalainen, "A computationally efficient multipitch analysis model," IEEE Trans. Speech, Audio Process, 8(6), 708-716, Nov. 2000 
  13. 13. F. Pachet and D. Cazaly,"A taxonomy of musical genres," Proc. Content-based Multimedia Information Access (RIAO), Paris, France, 2000 
  14. 14. P. A. Devijver and J. Kitter, Pattern Recognition: A statistical approach. (New York, Prentice-Hall, 1982) 
  15. 15. J.-J. Aucouturier and F. Pachet, "Representing music genre: A state of the Art," J. of New Music Research, 32(1), 83-93, 2003 
  16. 16. Huan Liu and Lei Yu, "Toward integrating feature selection algorithmsfor classification and clustering," IEEE Trans. on Knowledge and Data Eng., 17(4), April 2005 
  17. 17. http://ismir2004.ismir.net/genre_contest/index.htm 
  18. 18. V. Vapnik,"The nature of statistical learning theory,"New York; Springer-Verlag, 1995 
  19. 19. D. A. Reynolds and R. C. Rose, "Robust test-independent speaker identification using Gaussian mixture speaker models," IEEE Trans. Speech, Audio Process., 3(1), 47-60, Nov. 1996 
  20. 20. S-Y. Kung and J-N. Hwang, "Neural networks for intelligent multimedia processing," Proceedingsof the IEEE, 86(6), 1244-1272, June 1998 

문의하기 

궁금한 사항이나 기타 의견이 있으시면 남겨주세요.

Q&A 등록

원문보기

원문 PDF 다운로드

  • ScienceON :

원문 URL 링크

  • 원문 URL 링크 정보가 존재하지 않습니다.

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

DOI 인용 스타일

"" 핵심어 질의응답