$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

정보이론을 이용한 연속패턴생성방법
An Information-Theoretic Method for Sequential Pattern Analysis 원문보기

2001 가을 학술발표논문집(II)(Proceedings of the 28th KISS Fall Comference), 2001 Oct., 2001년, pp.124 - 126  

이창환 (동국대학교 정보통신공학과) ,  이소민 (동국대학교 정보통신공학과)

초록
AI-Helper 아이콘AI-Helper

시차를 두고 발생한 사건속에서 잠재해있는 패턴을 발견하는 연속패턴(sequential pattern) 생성기술은 데이터 마이닝 분야에서 최근 관심을 모으고 있는 분야이다. 본 연구는 정보이론을 이용하여 데이터베이스로부터 연속패턴을 자동으로 발견하는 방법에 관한 내용이다. 본 연구에서 제시하는 방법은 기존의 방법과는 달리 테이블내의 모든 속성간의 연속패턴 관계를 탐지할 수 있으며 헬링거(Hellinger) 변량을 이용하여 발견된 연속패턴들의 중요도를 측정할 수 있다. 또한 헬링거 변량의 함수적인 특성을 분석하여 연속패턴 추출의 복잡도를 줄이기 위한 두 가지의 법칙이 제안되었다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 주어진 데이터베이스로부터 전문가 수준의 지식을 자동으로 추출하여 사용할 수 있다면 대단히 유용할 것이다. 본 연구는 데이터 마이닝의 기술 중에서 연속 패턴의 생성에 대한 연구로서 시계열 데이터로부터 가잠계해있는 연속패턴을 정보이론을 이용하여 IF-THEN의 형식으로 자동 생성하는 기술에 관한 연구이다. 연속패턴의 생성에  대한 연구는 현재 몇 가지의 방법이 제안되어있으며 상용화되어있는 알고리즘도 있다.
  • 본 연구는 시차를 가지고 발생하 눈 데이터에 잠재하고있는 연속패턴을 자동으로 탐지하여 법칙의 형태로 제공하는 방법을 정보 이론의 헬링거 변량을 이용하여 제안하였다. 기존의 연속 패턴 방법이 오직 한 개의 속성에 대해서만 연속 패턴을 탐지하 는데 비하여 본 연구에서 제시하는 방법은 여러 속성 간의 연속 패턴을 탐지하는 기능을 제공할 수 있었으며 이는 사용자에게 훨씬 많은 정보를 제공할 수 있다.

가설 설정

  • 그다음으로 이후 확률분포를 계산할 때 먼저 IF 부분의 조건 고객 =C1 A 제품=P1을 만족하는 레코드 논 (1), (3), (7)임을 알 수 있다. 따라서 레코드 (1)에 의하여 레코드 (3)과 (7)이 원래의 데이터에 추가되는 것으로 가정하며 레코드 (3)에 의하여 레코드 (7)이 추가되는 것으로 가정한다. 즉 레코드 (7)은 이 법칙에 대하여 3반 추가된다.
  • 따라서 시스템은 웃너 속성의 변수 값(예를들어서  속성 B가 b와 같은 값을 가짐)을 우선 선택하고 B=b이라는 사건의 목표 속성 A의 부포값에 어떤 영향을 끼치는가를 점검한다. 만약 그것이 목표 속성의 확률 분포에 상당한 영향을 끼친다면 시스템은 다음과 같은 규칙이 있음을 가정한다.
  • 정리 1 : 목표 속성의 클래스 개수를 m 이라고 할 때 瓦 값은 다음의 경계값을 초과할 수 없다
  • 정리 2 : 만약 조건 확률 Rs 가 1이라면 & 의 反 값은 & 의 H값을 초과할 수 없다.
  • 이 경우 속성。의 이전확률분포률 계산하는 것은 법칙생성 알고리즘의 경우와 동일하다. 하지만 이후 확 昌 분포 豊 계산할 때 본 알고리즘은 전체 데이터 중에서 조건 A=a A B 그 b 롤 만족하는 각 데이터마다 해당 데이터의 행위자(보통 고객임) 데이터가 끝날 때까지의 잔여 레코드 중에서 조건 A=a A B=b를 만족하는 모든 레코드를 원래의 데이터에 추가되는 것으로 가정하고 이렇게 수정된 데이터의 분포를 이용하여 이후 확률분포를 계산한다.
본문요약 정보가 도움이 되었나요?

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로