$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 신경망의 민감도 분석을 이용한 귀납적 학습기법의 변수 부분집합 선정
Feature Subset Selection in the Induction Algorithm using Sensitivity Analysis of Neural Networks 원문보기

한국 지능정보시스템학회논문지 = Journal of intelligent information systems, v.7 no.2, 2001년, pp.51 - 63  

강부식 (목원대학교 경영정보학과) ,  박상찬 (한국과학기술원 산업공학과)

초록
AI-Helper 아이콘AI-Helper

데이터로부터 학습하여 룰을 추출하는 귀납적 학습기법은 데이터 마이닝의 주요 도구 중 하나이다. 귀납적 학습 기법은 불필요한 변수나 잡음이 섞인 변수를 포함하여 학습하는 경우 생성된 룰의 예측 성능이 떨어지고 불필요하게 룰이 복잡하게 구성될 수 있다. 따라서 귀납적 학습 기법의 예측력을 높이고 룰의 구성도 간단하게 할 수 있는 주요 변수 부분집합을 선정하는 방안이 필요하다. 귀납적 학습에서 예측력을 높이기 위해 많이 사용되는 부분집합 선정을 위한 포장 기법은 최적의 부분집합을 찾기 위해 전체 부분집합을 탐색한다. 이때 전체 변수의 수가 많아지면 부분집합의 탐색 공간이 너무 커져서 탐색하기 어려운 문제가 된다. 본 연구에서는 포장 기법에 신경망 민감도 분석을 결합한 귀납적 학습 기법의 변수 부분집합 선정 방안을 제시한다. 먼저, 신경망의 민감도 분석 기법을 이용하여 전체 변수를 중요도 순으로 순서화 한다. 다음에 순서화된 정보를 이용하여 귀납적 학습 기법의 예측력을 높일 수 있는 부분집합을 찾아 나간다. 제안된 방법을 세 데이터 셋에 적용한 결과 일정한 반복 회수 이내에 예측력이 향상된 부분집합을 얻을 수 있음을 볼 수 있다.

Abstract AI-Helper 아이콘AI-Helper

In supervised machine learning, an induction algorithm, which is able to extract rules from data with learning capability, provides a useful tool for data mining. Practical induction algorithms are known to degrade in prediction accuracy and generate complex rules unnecessarily when trained on data ...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 그러나 고려 해야 할 변수의 수가 많아지면 부분집합의 탐색 공간이 너무 커져서 풀기 어려운 문제가 된다. 본 연구에서는 귀납적 학습의 성능을 향상시키는 변수 부분집합을 선정하는데 있어 일정한 반복 회수 이내에 선정할 수 있도록 하기 위한 휴리스 틱 방법을 제안한다. 이 방안에서는 탐색 공간을 줄이기 위해 변수들 중에서 탐색할 순서를 미리 결정하고 이 순서에 따라 부분집합을 탐색하는 방안을 제시한다.
  • 본 연구에서는 귀납적 학습의 성능을 향상시키는 변수 부분집합을 선정하는데 있어 일정한 반복 회수 이내에 선정할 수 있도록 하기 위한 휴리스 틱 방법을 제안한다. 이 방안에서는 탐색 공간을 줄이기 위해 변수들 중에서 탐색할 순서를 미리 결정하고 이 순서에 따라 부분집합을 탐색하는 방안을 제시한다. 변수들의 탐색 순서는 클래스 를 판별하는 변수의 영향도에 따라 순서를 정하는 데, 판별 문제에 효과적인 기법 중의 하나인 신경망을 이용하여 변수들의 중요도를 결정하게 된다.
  • 세 가지 방법 중에서 이 논문에서는 변수 부분 집합 선정 기법에 대해 관심이 있으며 많은 응용 분야에서 판별 예측에 견고한 특성을 나타내는 C4.5의 예측력을 높이기 위한 부분집합 선정 기 법에 대해 살펴본다. 부분집합 선정 알고리즘은 크게 2가지로 나누어 지는데 기계학습 기법의 적용 이전의 전처리 작업으로 주요 부분집합을 선 정하느냐 아니면 기계학습 기법과 결합된 형태에서 주요 변수 부분집합을 선정하느냐에 따라[그림 1>과 같이 필터(句ter) 기법과 포장(wrapper) 기법으로 구분한다(Kohavi and John, 1998).
  • 5에 적용하 면 원래의 전체 변수를 가지고 생성한 의사결정 나무에 비해 간단한 의사결정나무를 구성할 수 있음을 필터 기법으로 보여 주었다. 본 연구에서는 C45의 예측력을 높이는 부분집합의 선정을 위한 포장 기법에서 포장 기법 사용 시의 탐색 공간을 줄이기 위한 방안으로 신경망의 민감도 분석을 이용하는 방법에 대해 살펴보고자 한다.
  • 따라서 결과를 판 별하는데 필요한 변수들만을 선정하여 귀납적 학 습 기법의 예측력을 높이는 것이 필요하다. 이 연구에서는 신경망을 이용하여 C4.5의 예측력을 높이기 위한 포장 기법에 대해 살펴보았다. 일반적인 포장 기법의 경우 전체 변수들의 모든 부분 집합을 탐색하게 되면 많은 탐색 시간이 걸림에 따라 현실적으로 적용하는데 어려움이 있다.
  • 본 연구에서는 Kamin의 개념을 이용하여 주요 변수의 영향도를 결정하고자 한다. 다만 에러 함수의 민감도 대신 출력 값의 민감도를 사용한다.
본문요약 정보가 도움이 되었나요?

저자의 다른 논문 :

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로