빈발 부분그래프는 그래프의 고유한 특성을 나타낼 수 있는 유용한 특징으로 그래프의 분류, 군집화, 인덱싱 등에서 사용된다. 최근에 최소 지지도를 변화시켜 가면서 또는 그래프 DB를 분할하며 반복적으로 빈발 부분 그래프를 마이닝하는 방법이 사용되고 있다. 이와 같은 마이닝 기법들은 수행 시간이 매우 길며, 반복되는 빈발 부분그래프 마이닝이 전체 시간의 대부분을 차지한다. 본 논문에서는 빈발 부분그래프 마이닝의 반복적 실행을 분석하여, 고비용인 그래프 정규화 연산의 중복 실행에 대하여 논한다. 빈발 부분그래프 마이닝이 수행될 때마다 같은 그래프에 대한 불필요한 정규화 연산을 방지하기 위하여, 그래프의 정규 형태를 트리 구조로 인덱싱하는 정규 그래프 탐색 트리를 제안한다. 또한 정규 그래프 탐색 트리를 압축하여 유지비용을 줄이는 방안을 함께 제안하다. 대표적인 반복적 마이닝 기법인 모델 기반 탐색 트리를 통한 실험에서 제안하는 기법이 기존의 방법보다 최대 15%까지 수행시간을 단축함을 보인다.
빈발 부분그래프는 그래프의 고유한 특성을 나타낼 수 있는 유용한 특징으로 그래프의 분류, 군집화, 인덱싱 등에서 사용된다. 최근에 최소 지지도를 변화시켜 가면서 또는 그래프 DB를 분할하며 반복적으로 빈발 부분 그래프를 마이닝하는 방법이 사용되고 있다. 이와 같은 마이닝 기법들은 수행 시간이 매우 길며, 반복되는 빈발 부분그래프 마이닝이 전체 시간의 대부분을 차지한다. 본 논문에서는 빈발 부분그래프 마이닝의 반복적 실행을 분석하여, 고비용인 그래프 정규화 연산의 중복 실행에 대하여 논한다. 빈발 부분그래프 마이닝이 수행될 때마다 같은 그래프에 대한 불필요한 정규화 연산을 방지하기 위하여, 그래프의 정규 형태를 트리 구조로 인덱싱하는 정규 그래프 탐색 트리를 제안한다. 또한 정규 그래프 탐색 트리를 압축하여 유지비용을 줄이는 방안을 함께 제안하다. 대표적인 반복적 마이닝 기법인 모델 기반 탐색 트리를 통한 실험에서 제안하는 기법이 기존의 방법보다 최대 15%까지 수행시간을 단축함을 보인다.
Frequent subgraphs represent intrinsic property of graphs and they can be used as significant features for various applications such as classification, clustering, and indexing of a graph DB. In order to select useful features, recent graph mining techniques applies repeated mining of frequent subgr...
Frequent subgraphs represent intrinsic property of graphs and they can be used as significant features for various applications such as classification, clustering, and indexing of a graph DB. In order to select useful features, recent graph mining techniques applies repeated mining of frequent subgraphs either by varying minimum supports or by dividing a graph DB recursively. Such mining techniques suffer from long runtime, and most of the runtime is spent for the repeated mining of frequent subgraphs. In this paper, we discuss redundant execution of expensive canonical graph operations through analyzing the repeated mining of frequent subgraphs. We then propose a novel canonical graph search tree for indexing canonical graphs that can reduce redundant canonical graph operations for the same graph. We also propose a compression technique for the canonical graph search tree in order to reduce the maintenance cost of the tree. In experiment, we show that the proposed technique can reduce runtime by up to 15% compared with the existing model based search tree.
Frequent subgraphs represent intrinsic property of graphs and they can be used as significant features for various applications such as classification, clustering, and indexing of a graph DB. In order to select useful features, recent graph mining techniques applies repeated mining of frequent subgraphs either by varying minimum supports or by dividing a graph DB recursively. Such mining techniques suffer from long runtime, and most of the runtime is spent for the repeated mining of frequent subgraphs. In this paper, we discuss redundant execution of expensive canonical graph operations through analyzing the repeated mining of frequent subgraphs. We then propose a novel canonical graph search tree for indexing canonical graphs that can reduce redundant canonical graph operations for the same graph. We also propose a compression technique for the canonical graph search tree in order to reduce the maintenance cost of the tree. In experiment, we show that the proposed technique can reduce runtime by up to 15% compared with the existing model based search tree.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.