Support Vector Machines을 이용한 다중 클래스 문제 해결
Solving Multi-class Problem using Support Vector Machines 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.32 no.12, 2005년, pp.1260 - 1270  

고재필 (금오공과대학교 컴퓨터공학과)

AI-Helper 아이콘AI-Helper

최근 기계학습 분야에서 커널머신을 이용한 대표적 학습기로 Support Vector Machines (SVM)이 주목 받고 있다. SVM은 통계적 학습이론에 기반하여 뛰어난 일반화 성능을 보여주며, 다양한 패턴인식 문제에 적용되고 있다. 그러나. SVM은 이진 분류기이므로 일반적인 다중 클래스 문제에 곧바로 적용할 수 없다. SVM을 다중 클래스 문제의 하나인 얼굴인식에 도입하기 위한 방법으로는, One-Per-Class와 All-Pairs가 대표적이다. 상기 두 방법은 다중 클래스 문제를 여러 개의 이진 클래스 문제로 분할하고, 이들을 다시 종합하여 최종 결정을 내리는 출력코딩이라는 일반적인 방법에 속한다. 본 논문에서는 이진 분류기인 SVM의 다중 클래스 분류기 확장 방안으로 출력코딩 방법론을 설명한다. 또한 출력코딩 방법론의 대표적인 이론적 기반인 ECOC(Ewor-Correcting Output Codes)를 근간으로 하는 새로운 출력코딩 방법들을 제안하고, 얼굴인식 실험을 통해 SVM을 기반 분류기로 사용할 경우의, 출력코딩 방법의 특성을 비교$\cdot$분석한다.

Abstract AI-Helper 아이콘AI-Helper

Support Vector Machines (SVM) is well known for a representative learner as one of the kernel methods. SVM which is based on the statistical learning theory shows good generalization performance and has been applied to various pattern recognition problems. However, SVM is basically to deal with a tw...


AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 복잡도가 높은 이진 문제 에 대한 이진 분류기의 출력은 그렇지 않은 분류기에 비해 출력한 값에 대한 신뢰도가 낮을 수 있다. 디코딩 과정에서 이를 고려하고자 한다. 기반 분류기 7 에 대한 가중치 wl 는 다음과 같이 계산한다.
  • Correcting Classifier(CC): CC는 ECOC의 근간이 되는, 분할행렬의 해밍거리를 크게 하는데 초점을 두어 개발한 방법론으로 전형적인 ECOC 방법론의 하나이다 [29]. 또한 All-Pairs의 넌센스출력의 문제를 다루기 위해 제안되었다. 각 이진 분류기 办는 클래스,,,와 나머지 클래스들을 구분하기 위해 학습된다.
  • 본 절에서는 이진 분류 문제의 복잡도를 추정하기 위한 직관적인 수치를 정의하여, 새로운 분할기법 설계 시 하나의 기준이 될 수 있도록 한다. 하나의 이진 분류기 를 학습하기 위해 여러 개의 클래스로 구성된 새로운 두 개의 클래스를 슈퍼클래스라 하자.
  • 직관적문제복잡도와 성능간의 관계 : 마진디코딩에서 는 해밍디코딩 때와는 달리 N-Shift 및 트리기반 기법 이 중복학습을 했음에도 불구하고, OPC보다 성능이 저 하되었음을 확인할 수 있다. 이러한 이유를 설명하기 위 해, IPC와 가중치기반디코딩 방법을 관찰해 본다.
  • 출력코딩 방법은 분할방법 및 복원방법에 따라 구분 되나, 본 논문에서는 분할방법을 기준으로 대표적 방법 론을 소개한다. 보다 자세한 구분 및 이에 따른 방법론 소개는 [28]을 참조하기 바란다.

가설 설정

  • 클래스의 개수가 40개인 경우(ORL 얼굴영상) 각 출 력코딩 방법에서 요구되는 이진 분류기의 개수와 최소 해밍거리를 표 6에 정리하였다. 여기서, 분할행렬의 0 요소와 관련된 해밍거리는 05로 가정하였다.
