OLAP(Online Analytical Processing)과 데이터 마이닝(Data Mining)은 CRM(Customer Relation Management, 고객관계관리)면으로 볼 때 상호 보완적인 기술이라고 할 수 있겠다. OLAP은 차원 계층을 기반으로 한 특별 데이터 구조로 되어 있으며, 측정값은 미리 집계된 형태로 저장되어 있다. OLAP 큐브는 다차원적인 데이터베이스인데, 의사결정 지원에 필요한 여러 문제를 해결하기 위해 만들어 쓰고 있다. 전형적인 큐브는 고객, 제품, 상점, 시간과 같이 여러개의 차원으로 정의되어 있고, 각각의 차원 구성원은 ...
OLAP(Online Analytical Processing)과 데이터 마이닝(Data Mining)은 CRM(Customer Relation Management, 고객관계관리)면으로 볼 때 상호 보완적인 기술이라고 할 수 있겠다. OLAP은 차원 계층을 기반으로 한 특별 데이터 구조로 되어 있으며, 측정값은 미리 집계된 형태로 저장되어 있다. OLAP 큐브는 다차원적인 데이터베이스인데, 의사결정 지원에 필요한 여러 문제를 해결하기 위해 만들어 쓰고 있다. 전형적인 큐브는 고객, 제품, 상점, 시간과 같이 여러개의 차원으로 정의되어 있고, 각각의 차원 구성원은 계층 구조로 되어 있다. RDB(Relational Database)를 기반으로 하는 현재의 OLAP 큐브는 아주 복잡하고 거대하기 때문에 OLAP 큐브에서 유용한 정보를 찾아내기는 무척 힘겹게 된다. 따라서 이러한 큐브로부터 고객의 구매 패턴과 같은 CRM적인 정보를 찾기 위해서는 데이터마이닝 기술을 활용할 필요가 생기는 것이다. 아이템세트란 아이템의 집합을 말한다. 각각의 아이템 세트는 아이템세트에 포함되어 있는 아이뎀들의 수로 그 크기를 나타낸다. 판매 트랜잭션은 크기에 따라 두 가지 그룹으로 분리 할 수 있는데, 그룹Ⅰ 트랜잭션은 하나의 아이템으로만 구성된 아이템 세트이고, 그룹Ⅱ 트랜잭션은 두 개 이상의 아이템들로도 구성되어 있는 아이템 세트이다. 스타 스키마라고 불리는 현재의 OLAP 스키마에서는 판매 트랜잭션의 데이터 테이블이 사실 테이블이 된다. 이 사실 테이블은 RDB에 관한한 릴레이션이 되어야만 하는데, 사실 테이블이 릴레이션이 되기 위해서는 판매 트랜잭션의 행들의 순서가 사실 테이블에서 무관하여야만 한다. 그룹Ⅰ 트랜잭션에 대한 트랜잭션의 행의 순서는 사실 테이블에서 무관하게 구성될 수 있지만, 그룹Ⅱ 트랜잭션은 트랜잭션 행의 순서대로 구성되어야 하므로 이 요구 조건을 만족시켜 줄 수 없다. 그룹Ⅱ 트랜잭션은 릴레이션이 되지 못함으로 인해서 심각한 문제가 생기게 된다. 고객이 제품을 구매할 때에는 항시 구매패턴이 생기기 마련인데, 이러한 구매패턴을 찾아 나가는 과정을 장바구니 분석이라고 부른다. 장바구니 분석은 Microsoft Association Algorithm에서는 두 가지 단계로 구성되어 있는데, 첫 번째 단계는 빈발항목집합을 찾아내는 과정이고, 두 번째 단계는 첫 번째 단계에서 찾은 빈발항목집합을 근거로 하여 이들의 중요도를 비교하는 단순한 계산과정이다. 빈발항목집합을 찾아내는 첫 번째 단계는 장바구니 분석에 있어서 핵심부분임에도 불구하고, 그룹Ⅱ 트랜잭션으로 된 사실테이블에 적용할 때에는 추적분석이 불가능해지거나 허구의 빈발항목집합이 생성되는 등 여러 문제가 발생하게 된다. 본 연구에서는 장바구니 분석에 있어서 추적분석을 가능하게 하고 실제의 빈발항목집합만을 생성시키는 새로운 OLAP 큐브 구조의 설계법을 제안하고 있다. 사실 테이블에서의 트랜잭션 행은 본래 여러 측정값과 시간차원의 기본키, 그리고 다른 여러 차원의 기본키를 포함하여 구성되어 있다. 그러나 어떤 정해진 기간 동안 추적분석을 수행 할 때에는 시간 차원이 의미가 없어지게 되기 때문에, 그룹Ⅰ 트랜잭션이든 그룹Ⅱ 트랜잭션이든 간에 사실 테이블의 트랜잭션 행이 실제의 트랜잭션 행들보다 적어지게 된다. 이렇게 실제보다 적은 수의 트랜잭션을 갖는 사실 테이블로 분석하면 심각한 문제가 발생하게 된다. 본 연구에서는 트랜잭션 행들의 수가 적어짐으로 인해서 발생하는 문제들을 해결하고자 사실 테이블 내에 트랜잭션 열을 추가하는 또 하나의 새로운 개념의 데이터 구조 기법을 제안하고 있다.
OLAP(Online Analytical Processing)과 데이터 마이닝(Data Mining)은 CRM(Customer Relation Management, 고객관계관리)면으로 볼 때 상호 보완적인 기술이라고 할 수 있겠다. OLAP은 차원 계층을 기반으로 한 특별 데이터 구조로 되어 있으며, 측정값은 미리 집계된 형태로 저장되어 있다. OLAP 큐브는 다차원적인 데이터베이스인데, 의사결정 지원에 필요한 여러 문제를 해결하기 위해 만들어 쓰고 있다. 전형적인 큐브는 고객, 제품, 상점, 시간과 같이 여러개의 차원으로 정의되어 있고, 각각의 차원 구성원은 계층 구조로 되어 있다. RDB(Relational Database)를 기반으로 하는 현재의 OLAP 큐브는 아주 복잡하고 거대하기 때문에 OLAP 큐브에서 유용한 정보를 찾아내기는 무척 힘겹게 된다. 따라서 이러한 큐브로부터 고객의 구매 패턴과 같은 CRM적인 정보를 찾기 위해서는 데이터마이닝 기술을 활용할 필요가 생기는 것이다. 아이템세트란 아이템의 집합을 말한다. 각각의 아이템 세트는 아이템세트에 포함되어 있는 아이뎀들의 수로 그 크기를 나타낸다. 판매 트랜잭션은 크기에 따라 두 가지 그룹으로 분리 할 수 있는데, 그룹Ⅰ 트랜잭션은 하나의 아이템으로만 구성된 아이템 세트이고, 그룹Ⅱ 트랜잭션은 두 개 이상의 아이템들로도 구성되어 있는 아이템 세트이다. 스타 스키마라고 불리는 현재의 OLAP 스키마에서는 판매 트랜잭션의 데이터 테이블이 사실 테이블이 된다. 이 사실 테이블은 RDB에 관한한 릴레이션이 되어야만 하는데, 사실 테이블이 릴레이션이 되기 위해서는 판매 트랜잭션의 행들의 순서가 사실 테이블에서 무관하여야만 한다. 그룹Ⅰ 트랜잭션에 대한 트랜잭션의 행의 순서는 사실 테이블에서 무관하게 구성될 수 있지만, 그룹Ⅱ 트랜잭션은 트랜잭션 행의 순서대로 구성되어야 하므로 이 요구 조건을 만족시켜 줄 수 없다. 그룹Ⅱ 트랜잭션은 릴레이션이 되지 못함으로 인해서 심각한 문제가 생기게 된다. 고객이 제품을 구매할 때에는 항시 구매패턴이 생기기 마련인데, 이러한 구매패턴을 찾아 나가는 과정을 장바구니 분석이라고 부른다. 장바구니 분석은 Microsoft Association Algorithm에서는 두 가지 단계로 구성되어 있는데, 첫 번째 단계는 빈발항목집합을 찾아내는 과정이고, 두 번째 단계는 첫 번째 단계에서 찾은 빈발항목집합을 근거로 하여 이들의 중요도를 비교하는 단순한 계산과정이다. 빈발항목집합을 찾아내는 첫 번째 단계는 장바구니 분석에 있어서 핵심부분임에도 불구하고, 그룹Ⅱ 트랜잭션으로 된 사실테이블에 적용할 때에는 추적분석이 불가능해지거나 허구의 빈발항목집합이 생성되는 등 여러 문제가 발생하게 된다. 본 연구에서는 장바구니 분석에 있어서 추적분석을 가능하게 하고 실제의 빈발항목집합만을 생성시키는 새로운 OLAP 큐브 구조의 설계법을 제안하고 있다. 사실 테이블에서의 트랜잭션 행은 본래 여러 측정값과 시간차원의 기본키, 그리고 다른 여러 차원의 기본키를 포함하여 구성되어 있다. 그러나 어떤 정해진 기간 동안 추적분석을 수행 할 때에는 시간 차원이 의미가 없어지게 되기 때문에, 그룹Ⅰ 트랜잭션이든 그룹Ⅱ 트랜잭션이든 간에 사실 테이블의 트랜잭션 행이 실제의 트랜잭션 행들보다 적어지게 된다. 이렇게 실제보다 적은 수의 트랜잭션을 갖는 사실 테이블로 분석하면 심각한 문제가 발생하게 된다. 본 연구에서는 트랜잭션 행들의 수가 적어짐으로 인해서 발생하는 문제들을 해결하고자 사실 테이블 내에 트랜잭션 열을 추가하는 또 하나의 새로운 개념의 데이터 구조 기법을 제안하고 있다.
OLAP(Online Analytical Processing) and data mining are two complementary technologies for CRM(Customer Relation Management). OLAP is about aggregating measures based on dimension hierarchies and storing these precalculated aggregations in a special data structure. An OLAP cube is built for decision-...
OLAP(Online Analytical Processing) and data mining are two complementary technologies for CRM(Customer Relation Management). OLAP is about aggregating measures based on dimension hierarchies and storing these precalculated aggregations in a special data structure. An OLAP cube is built for decision-support queries. The cube is a multidimensional database. A typical cube contains a set of well-defined dimensions such as Customer, Product, Store, and Time. Each dimension contains many members. Dimension members are organized by hierarchies. Current OLAP cubes based on RDB(Relational Database) are of the very complicated and large. Finding useful information in such large cube is challenging. There is definitely a requirement in applying data mining techniques to dig the patterns out of these cubes. An itemset is a set of items. Each itemset has a size, which is the number of items contained in the itemset. Sales transactions can be divided into two groups : GroupⅠ transactions whose sizes are all one, and GroupⅡ transactions with itemsets of size one or greater. In the current OLAP schema so called a star schema, the base sales transactions data table becomes a fact table. This fact table should be a relation as far as relational databases are concerned. For a fact table to be a relation, the order of the sale transactions rows should be immaterial. Although in the fact table composed of GroupⅠ transactions, the order of the transaction rows is immaterial, in the fact table composed of GroupⅡ transactions the order of the transaction rows is required. The fact tables with GroupⅡ transactions which cannot be relations would cause serious problems. Every purchase a customer makes builds patterns of how products are purchased together. The process of finding these patterns, called market basket analysis, is composed of two steps in the Microsoft Association Algorithm. The first step is to find frequent itemsets. The second step which requires much less time than the first step does is to generate association rules based on the frequent itemsets. Even though the first step, finding frequent itemsets, is the core part of market basket analysis, when applied to the fact tables with GroupⅡ transactions it always raises several issues such as longitudinal analysis becoming impossible and many unpractical transactions are built up. In this paper, a new OLAP cube structures designing method which allows longitudinal analysis and also makes only real customers' purchase patterns to be identified is proposed for market basket analysis. When a longitudinal analysis over a period of time is carried out on the fact table containing variables, time key, and other dimension keys, the transaction rows in the fact table originally dimensioned by time could now be thought as not dimensioned by time. Due to this fact, the number of transaction rows of the fact table, whether with GroupⅠ or with GroupⅡ transactions, can be less than the number of real transaction rows. The fact tables with less transaction rows may cause serious problems. In an attempt to solve the problem of decreasing number of transaction rows, a new concept of data structuring technique is also suggested in this paper.
OLAP(Online Analytical Processing) and data mining are two complementary technologies for CRM(Customer Relation Management). OLAP is about aggregating measures based on dimension hierarchies and storing these precalculated aggregations in a special data structure. An OLAP cube is built for decision-support queries. The cube is a multidimensional database. A typical cube contains a set of well-defined dimensions such as Customer, Product, Store, and Time. Each dimension contains many members. Dimension members are organized by hierarchies. Current OLAP cubes based on RDB(Relational Database) are of the very complicated and large. Finding useful information in such large cube is challenging. There is definitely a requirement in applying data mining techniques to dig the patterns out of these cubes. An itemset is a set of items. Each itemset has a size, which is the number of items contained in the itemset. Sales transactions can be divided into two groups : GroupⅠ transactions whose sizes are all one, and GroupⅡ transactions with itemsets of size one or greater. In the current OLAP schema so called a star schema, the base sales transactions data table becomes a fact table. This fact table should be a relation as far as relational databases are concerned. For a fact table to be a relation, the order of the sale transactions rows should be immaterial. Although in the fact table composed of GroupⅠ transactions, the order of the transaction rows is immaterial, in the fact table composed of GroupⅡ transactions the order of the transaction rows is required. The fact tables with GroupⅡ transactions which cannot be relations would cause serious problems. Every purchase a customer makes builds patterns of how products are purchased together. The process of finding these patterns, called market basket analysis, is composed of two steps in the Microsoft Association Algorithm. The first step is to find frequent itemsets. The second step which requires much less time than the first step does is to generate association rules based on the frequent itemsets. Even though the first step, finding frequent itemsets, is the core part of market basket analysis, when applied to the fact tables with GroupⅡ transactions it always raises several issues such as longitudinal analysis becoming impossible and many unpractical transactions are built up. In this paper, a new OLAP cube structures designing method which allows longitudinal analysis and also makes only real customers' purchase patterns to be identified is proposed for market basket analysis. When a longitudinal analysis over a period of time is carried out on the fact table containing variables, time key, and other dimension keys, the transaction rows in the fact table originally dimensioned by time could now be thought as not dimensioned by time. Due to this fact, the number of transaction rows of the fact table, whether with GroupⅠ or with GroupⅡ transactions, can be less than the number of real transaction rows. The fact tables with less transaction rows may cause serious problems. In an attempt to solve the problem of decreasing number of transaction rows, a new concept of data structuring technique is also suggested in this paper.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.