$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] Concurrent Support Vector Machine 프로세서
Concurrent Support Vector Machine Processor 원문보기

전기학회논문지. The transactions of the Korean Institute of Electrical Engineers. D / D, 시스템 및 제어부문, v.53 no.8, 2004년, pp.578 - 584  

위재우 (인하대 공대 전기공학과) ,  이종호 (인하대 공대 정보통신공학부)

Abstract AI-Helper 아이콘AI-Helper

The CSVM(Current Support Vector Machine) that is a digital architecture performing all phases of recognition process including kernel computing, learning, and recall of SVM(Support Vector Machine) on a chip is proposed. Concurrent operation by parallel architecture of elements generates high speed a...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • 개수를 나타내었다. CSVM은 백혈병 데이터 문제에 적합한 크기인 40개의 SVE와 4000개의 데이터를 처리 가능하도록 설계하였다. 설계 결과 각 단계에 필요한 사이클은 표 7과 같았다.
  • 모든 SVE 간은 공유버스로 연결을 시켜서 커널 연산이 동시에 이루어지게 하였다. KA와 KP 학습 알고리즘의 유사한 점을 이용하여 칩에 KA, KP 두 가지학습 방법을 함께 내장하였고 SVE를 이용하여 커널 계산, 학습과 재현 동작을 모두 함으로써 적은 면적에 효과적으로 설계하였다. LE는 학습 단계의 파라미터 갱신을 위한 계산 시에만 사용된다.
  • 전처리 과정[9] 을 통해서 얻은 35기개의 유전자를 실험에 사용하였다. KP 알고리즘과 RBF커널 함수를 사용한 부동소수점 알고리즘실험을 통해서 단지 1개의 테스트 패턴을 오분류하였다. 표 5는 고정소수점 알고리즘을 사용하여 다양한 데이터 폭과커널 스케일율에 따라 얻은 테스트오차의 수를 나타내고 있다.
  • RBF 연산에서 두 번째 곱셈기의 출력 값은 지수함수 LUT로 통과하게 된다. LUT의 입력비트의 크기에 비례하여 메모리 공간을 차지하므로 실험을 통하여 입력 비트의 크기를 결정하였다.
  • 병렬 구조와 공유 버스를 이용한 concurrent 동작으로 빠른 SVM 연산이 가능하고 특히 고차원의 데이터의 분류 문제에 적합하다. 많은 계산을 요구하여 지금까지 호스트컴퓨터에서 off-line으로 수행하던 SVM의 커널 연산을하드웨어 위에서 공유 데이터 버스를 이용하여 빠르게 처리하였다. 커널 연산을 포함한 SVM에서 필요한 모든 연산이 CSVM 하드웨어 위에서 한 번에 빠르게 이루어지므로 온라인, 독립적인 수행(staimd-alone)이 요구되는 적용분야에 사용 가능하다.
  • 성능을 평가한다. 바이오인포매틱스 문제로서 DNA chip으로부터의 고차원의 유전자 발현 데이터를 이용하여백혈병 암의 종류를 분류하고자 한다. 또한, 분류기의 성능올 비교하는 데 많이 사용되는 벤치마크 데이터인 수중 음파 데이터로 실험을 하였다.
  • CSVM의 구조는 그림 3과 같다. 본 하드웨어는 SVM의 마진 상에 위치하는 support vector# 기본단위로 하여 SVE(Support Vector Element) 모듈을 병렬 처리하여 연산속도를 증가시켰다. SVE의 개수는 학습샘플의 개수이며 학습 결과 0이 아닌 값을 갖는 SVE가 support vector가 된다.
  • 우리는 공유 데이터 버스를 이용한 병렬 연산과 온칩 커널 연산을 사용하는 효율적인 CSVM 하드웨어 구조를 제안하였다. 병렬 구조와 공유 버스를 이용한 concurrent 동작으로 빠른 SVM 연산이 가능하고 특히 고차원의 데이터의 분류 문제에 적합하다.
  • 이 논문에서 제안하는 CSVM(Concurrent Support Vector Machine)은 계산속도가 빠른 커널 계산부를 내장형으로 만들어서 한 하드웨어에서 SVM의 모든 과정이 수행되는 통합기능을 구현하였다. 기존에 사용되는 SVM 학습 알고리즘인 QP(Quadratic Programming) 방법은 연산이 복잡하고많은 메모리를 소모하여 하드웨어 구현에 부적합하다.
  • 발생한다. 이 양자화오차에도 불구하고 시스템의 성능을 저하시키지 않고 부동소수점 연산과 동일한 성능을 얻을 수 있는 최소의 데이터 폭을 찾는 실험을 수행하였다.
  • 커널 함수 모듈은 면적을 최소화하기 위하여 곱셈기 2개만으로 3종류의 커널 함수를 설계하였다. 첫 번째 곱셈기에서는 선형, 다항 함수의 X xi, 연산을 하고 RBF 함수의 (X-xi)-(X-xi) 연산을 한다.

대상 데이터

  • 이 데이터는 72명의 환자에대한 각 7129개의 유전자로 이루어져 있다. 72명의 환자 샘플 중에 38명의 데이터는 학습을 위해서 사용되었고 나머지 34명의 데이터는 테스트용으로 사용되었다. 전처리 과정[9] 을 통해서 얻은 35기개의 유전자를 실험에 사용하였다.
  • 바이오인포매틱스 문제로서 DNA chip으로부터의 고차원의 유전자 발현 데이터를 이용하여백혈병 암의 종류를 분류하고자 한다. 또한, 분류기의 성능올 비교하는 데 많이 사용되는 벤치마크 데이터인 수중 음파 데이터로 실험을 하였다. 수중 음파 데이터의 분류 문제는 데이터의 차원이 높고 학습데이터와 테스트데이터 간의중복 정도가 낮아서 어려운 문제로 알려져 있다.
  • 72명의 환자 샘플 중에 38명의 데이터는 학습을 위해서 사용되었고 나머지 34명의 데이터는 테스트용으로 사용되었다. 전처리 과정[9] 을 통해서 얻은 35기개의 유전자를 실험에 사용하였다. KP 알고리즘과 RBF커널 함수를 사용한 부동소수점 알고리즘실험을 통해서 단지 1개의 테스트 패턴을 오분류하였다.

이론/모형

  • 기존에 사용되는 SVM 학습 알고리즘인 QP(Quadratic Programming) 방법은 연산이 복잡하고많은 메모리를 소모하여 하드웨어 구현에 부적합하다. CSVM은 반복 갱신 방식으로 하드웨어 구현이 용이하고 수렴성이 보장되는 SVM 학습 알고리즘의 하나인 KA(Kemel Adatron)[5] 및 KP(Kemel Perceptron)[4] 알고리즘을 사용한다. 또한 많은 연산이 요구되는 커널 연산을 병렬적으로수행함으로써 소요시간을 단축시키고자 하며, 커널 값을 일정한 범위에 제한하는 커널 스케일링 방법[6]을 사용하여 하드웨어의 면적을 최소화한다.
  • CSVM은 반복 갱신 방식으로 하드웨어 구현이 용이하고 수렴성이 보장되는 SVM 학습 알고리즘의 하나인 KA(Kemel Adatron)[5] 및 KP(Kemel Perceptron)[4] 알고리즘을 사용한다. 또한 많은 연산이 요구되는 커널 연산을 병렬적으로수행함으로써 소요시간을 단축시키고자 하며, 커널 값을 일정한 범위에 제한하는 커널 스케일링 방법[6]을 사용하여 하드웨어의 면적을 최소화한다. 고차원의 데이터를 가지는 암진단 분류 문제 등에 적용하며 온라인상에서 즉시 (point-of- care) 진단 결과를 요구하는 분야에서 적합한 구조를 지닌다.
  • 계산량이 많고 구현하기 어렵다. 본 논문에서는 QP 방법이 아닌 구현하기 쉬운 KA와 KP 학습 알고리즘을 사용한다.
  • 결국 KA 알고리즘은 SVM의 특징공간에 adatron을 도입하는 것으로 용이한 구현성 뿐만 아니라 커널에 의한 비선형 특징공간에서의 단순한 동작 특성도 동시에 얻을 수 있어, 기존 QP 학습 알고리즘이 가지는 계산과 구현상의 제약들을 효과적으로 해결할 수 있다. 본 논문에서는 표 1과 같은 바이어스를 사용하지 않는 KA 알고리즘이 사용된다.
  • 우리의 하드웨어의 성능을 입증하기 위하여 바이오인포매틱스 문제와 수중 음파(sonar)분류문제에 적용하여 연산시간과 성능을 평가한다. 바이오인포매틱스 문제로서 DNA chip으로부터의 고차원의 유전자 발현 데이터를 이용하여백혈병 암의 종류를 분류하고자 한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (10)

  1. Furey T.S., Cristianini N., Duffy N., Bedharski D.W., Schummer M. and Haussler D., 'Support vector machine classification and validation of cancer tissue samples using microarray expression data', Bioinformatics, Vol. 16, No. 10, pp. 906-914, 2000 

  2. Genov, R. and Cauwenberghs, G., 'Kerneltron: support vector 'machine' in silicon', IEEE Transactions on Neural Networks, Vol. 14, No. 5, pp.1426-1434, 2003 

  3. D. Anguita, A. Boni and S. Ridella, 'A digital architecture for support vector machines: theory, algorithm and FPGA implementation', IEEE Transactions on Neural Networks, Vol. 14, No. 5, pp. 993-1009, 2003 

  4. D. Anguita, A. Boni and S. Ridella, 'Digital kernel perceptron', Electronics Letters, Vol. 38, No. 10, pp.445-446, 2002 

  5. T.T. Friess, N. Cristianini and C. Campbell, 'The kernel-adatron algorithm: a fast and simple learning procedure for support vector machines', 15th International Conference on Machine Learning, Wisconsin, USA, pp. 188-196, July 1998 

  6. B. Scholkopf and A. J. Smola, Learning with kernels: support vector machines, regularization, optimization, and beyond, MIT Press, 2002 

  7. Vapnik V.N., Statistical Learning Theory, John Wiley and Sons, New Work, 1998 

  8. T. R. Golub, D. K. Slonim, P. Tamayo, C. Huard, M. Gaasenbeek, J. P. Mesirov, H. Coller, M. L. Loh, J. R. Downing, M. A. caligiuri, C. D. Bloomfield and E. S. Lander, 'Molecular classification of cancer: class discovery and class prediction by gene expression monitoring', Science, Vol. 286, pp. 531-537, 1999 

  9. S. Dudoit, J. Fridlyand and T. P. Speed, 'Comparison of discrimination methods for the classification of tumors using gene expression data', Journal of the American Statistical Association, Vol. 97, No. 457, pp. 77-87, 2002 

  10. Nello C. and John S. T., An Introduction to Support Vector Machine, Cambridge University Press, 2000 

저자의 다른 논문 :

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로