$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"
쳇봇 이모티콘
안녕하세요!
ScienceON 챗봇입니다.
궁금한 것은 저에게 물어봐주세요.

논문 상세정보

재귀분할을 이용한 새로운 점진적 인스턴스 기반 학습기법

A New Incremental Instance-Based Learning Using Recursive Partitioning

초록

인스턴스 기반 학습의 대표적인 알고리즘인 k-NK(K-Nearest Neighbors)은 단순히 전체 학습패턴을 메모리에 저장한 다음, 분류할 때 학습 패턴들과의 거리를 계산하여 가장 가까운 학습패턴의 클래스로 테스트 패턴을 분류한다. K-NN 기법은 만족할 만한 분류성능을 보여주지만, 학습패턴의 개수가 늘어나면 메모리와 분류 시간이 증가하는 문제점을 가지고 있다. 그러므로, 메모리의 효율적 사용과 분류 시간을 단축시키기 위한 다양한 연구들이 발표되었으며, 그 대표적인 예로 NGE(Nested Generalized Exemplar) 이론을 들 수 있다. 본 논문에서는 학습패턴의 집합으로부터 대표패턴을 생성하는 RPA(Recursive Partition Averaging)기법과 점진적으로 대표패턴을 추출하는 IRPA(Incremental RPA)기법을 제안하였다. RPA기법은 전체 학습패턴의 공간을 재귀적으로 분할하면서 대표패턴을 생성하며, IRPA 기법은 RPA 기법의 특성상 패턴의 특징 개수가 많은 경우, 과도한 분할로 인하여 생성되는 많은 개수의 대표패턴을 줄이기 위하여 점진적으로 대표패턴을 추출하는 알고리즘이다. 본 논문에서 제안한 기법은 기존의 k-NN 기법과 비교하여 현저하게 줄어든 대표패턴을 이용하석 유사한 분류 성능을 보여주며, NGE 이론을 구현한 EACH 시스템과 비교하여 탁월한 분류 성능을 보여준다.

Abstract

K-NN (k-Nearest Neighbors), which is a well-known instance-based learning algorithm, simply stores entire training patterns in memory, and uses a distance function to classify a test pattern. K-NN is proven to show satisfactory performance, but it is notorious formemory usage and lengthy computation. Various studies have been found in the literature in order to minimize memory usage and computation time, and NGE (Nested Generalized Exemplar) theory is one of them. In this paper, we propose RPA (Recursive Partition Averaging) and IRPA (Incremental RPA) which is an incremental version of RPA. RPA partitions the entire pattern space recursively, and generates representatives from each partition. Also, due to the fact that RPA is prone to produce excessive number of partitions as the number of features in a pattern increases, we present IRPA which reduces the number of representative patterns by processing the training set in an incremental manner. Our proposed methods have been successfully shown to exhibit comparable performance to k-NN with a lot less number of patterns and better result than EACH system which implements the NGE theory.

참고문헌 (13)

  1. T. Dietterich, 'A Study of Distance-Based Machine Learning Algorithms', Ph. D. Thesis, computer Science Dept., Oregon State University, 1995 
  2. D. Wettschereck and T. Dietterich, 'Locally Adaptive Nearest Neighbor Algorithms', Advances in Neural Information Processing Systems 6, pp.184-191, Morgan Kaufmann, San Mateo, CA. 1994 
  3. D. Wettschereck, 'Weighted k-NN versus Majority k-NN A Recommendation'. German National Research Center for Information Technology, 1995 
  4. D. Aha, 'A Study of Instance-Based Algorithms for Supervised Learning Tasks: Mathematical, Empirical, and Psychological Evaluations', Ph. D. Thesis, Information and Computer Science Dept., University of California, Irvine, 1990 
  5. D. Aha, 'Instance-Based Learning Algorithms, Machine Learning', Vol. 6, No.1, pp, 37-66, 1991 
  6. D. Wettschereck and T. Dietterich, 'An Experimental Comparison of the Nearest-Neighbor and NearestHyperrectangle Algorithms', Machine Learning, Vol.19, No. 1, pp.1-25, 1995 
  7. S. Salzberg, 'A Nearest hyperrectangle learning method, Machine Learning', No.1, pp.251-276, 1991 
  8. D. Wettschereck, et al., 'A Review and Empirical Evaluation of Feature Weighting Methods for a Class of Lazy Learning Algorithms', Artificial Intelligence Review Journal, 1996 
  9. 심범식, 정태선, 윤충화, '최근접 초월평면 학습법에서 시드개수의 영향에 대한 분석' 한국정보처리학회 '98 춘계학술대회, 1998 
  10. 이형일, 정태선, 윤충화, 강경식, '재귀 분할 평균법을 이용한 새로운 메모리기반 추론 알고리즘' 한국정보처리학회논문지,Vol.006, No.007, pp.1849-1857, 1999 
  11. Ian H. Witten, Eibe Frank, 'Data Mining', Morgan Kaufmann, pp.89-94, 1999 
  12. http://www.ics.uci.edu/-mlearn 
  13. O. L. Mangasarian and W. H. Wolberg: 'Cancer diagnosis via linear programming', SIAM News, Vol.23, No.5, pp.1 & 18, September, 1990 

이 논문을 인용한 문헌 (0)

  1. 이 논문을 인용한 문헌 없음

원문보기

원문 PDF 다운로드

  • ScienceON :

원문 URL 링크

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

상세조회 0건 원문조회 0건

DOI 인용 스타일