최근 정보기술이 발달하면서 수많은 자료들이 체계화된 데이터베이스에 저장이 되고, 기업의 데이터베이스의 규모는 폭발적으로 증가되고 있다. 데이터 마이닝(Data Mining)은 이런 방대한 자료의 분석을 통해, 그 속에 숨어있는 의미를 찾는 과정이라고 볼 수 있다. 본 논문에서는 자동차 마케팅에서 이용 가능한 데이터를 데이터 마이닝 분석 기법중의 하나인 연관규칙(association rule)에 따라 분석하였다. 본 논문에서 제시하고자 하는 바는 기존 고객에 대한 분류 및 고객 속성파악, 고객 분류 및 분석에 따른 고객의 연관규칙을 수행하여 해당 기업의 전략적 마케팅 수립을 통해 경영 과학적으로 접근할 수 있는 데이터 마이닝 분석에 관한 사례 연구이다. 본 논문의 분석 사례를 통하여 자동차 분야의 특성에 따라 효과적인 분석 및 의사결정과 더 나아가 CRM마케팅, 동향분석 및 예측 등에 유용한 정보를 분석할 수 있는 사례로 활용될 수 있다.
최근 정보기술이 발달하면서 수많은 자료들이 체계화된 데이터베이스에 저장이 되고, 기업의 데이터베이스의 규모는 폭발적으로 증가되고 있다. 데이터 마이닝(Data Mining)은 이런 방대한 자료의 분석을 통해, 그 속에 숨어있는 의미를 찾는 과정이라고 볼 수 있다. 본 논문에서는 자동차 마케팅에서 이용 가능한 데이터를 데이터 마이닝 분석 기법중의 하나인 연관규칙(association rule)에 따라 분석하였다. 본 논문에서 제시하고자 하는 바는 기존 고객에 대한 분류 및 고객 속성파악, 고객 분류 및 분석에 따른 고객의 연관규칙을 수행하여 해당 기업의 전략적 마케팅 수립을 통해 경영 과학적으로 접근할 수 있는 데이터 마이닝 분석에 관한 사례 연구이다. 본 논문의 분석 사례를 통하여 자동차 분야의 특성에 따라 효과적인 분석 및 의사결정과 더 나아가 CRM마케팅, 동향분석 및 예측 등에 유용한 정보를 분석할 수 있는 사례로 활용될 수 있다.
Recently, According to computer technology has been improving, Massive customer data has stored in database. Using this massive data, decision maker can extract the useful information to make a valuable plan with data mining. Data mining offers service providers great opportunities to get closer to ...
Recently, According to computer technology has been improving, Massive customer data has stored in database. Using this massive data, decision maker can extract the useful information to make a valuable plan with data mining. Data mining offers service providers great opportunities to get closer to customer. Data mining doesn't always require the latest technology, but it does require a magic eye that looks beyond the obvious to find and use the hidden knowledge to drive marketing strategies Automotive market face an explosion of data arising from customer but a rate of increasing customer is getting lower. therefore, we need to determine which customer are profitable clients whom you wish to hold. This paper builds model of customer loyalty detection and analyzes customer patterns in automotive market with data mining using association rule and basic statics methods. With 4he help of information technology.
Recently, According to computer technology has been improving, Massive customer data has stored in database. Using this massive data, decision maker can extract the useful information to make a valuable plan with data mining. Data mining offers service providers great opportunities to get closer to customer. Data mining doesn't always require the latest technology, but it does require a magic eye that looks beyond the obvious to find and use the hidden knowledge to drive marketing strategies Automotive market face an explosion of data arising from customer but a rate of increasing customer is getting lower. therefore, we need to determine which customer are profitable clients whom you wish to hold. This paper builds model of customer loyalty detection and analyzes customer patterns in automotive market with data mining using association rule and basic statics methods. With 4he help of information technology.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그러므로 본 논문에서 제시하고자 하는 것은 기존 고객에 대한 연관규칙, 및 고객속성 파악, 기존 고객 분류에 따른 신규고객의 분류 예측 두 가지를 수행하여 해당 기업의 마케팅 전략수립에서부터 경영 과학적으로 접근할 수 있는 데이터마이닝 분석 방법을 제시하고자 한다[26].
본 논문에서는 자동차 완성업체에서 이용 가능한 전산 데이터를 이용하여 데이터마이닝 방법론 중의 하나인 연관규칙을 이용하여 기존고객을 세분화한 다음 고객 개개인의 특성에 맞는 마케팅 프로모션을 하게 하고 신규고객을 획득할 때는 신규고객의 특성을 미리 예측하여 세분화함으로써 고객의 평생가치를 촉진하여 기업과 고객과의 관계성을 높여서 기업은 안정된 고객층으로부터 수익을 창출하고 고객들은 해당 기업으로부터 더 많은 혜택을 받게 하는데 목적이 있다. 그러므로 본 논문에서 제시하고자 하는 것은 기존 고객에 대한 연관규칙, 및 고객속성 파악, 기존 고객 분류에 따른 신규고객의 분류 예측 두 가지를 수행하여 해당 기업의 마케팅 전략수립에서부터 경영 과학적으로 접근할 수 있는 데이터마이닝 분석 방법을 제시하고자 한다[26].
본 논문은 국내 자동차 완성 업체인 A사의 자료를 입수하여 실제 데이터를 중심으로 연구하였다. 또한 SAS 를 이용하여 고객 data에서 변수 추출 및 정제작업을 실시하였다.
마이닝 응용분야 등을 살펴보고. 본론에서는 자동차 완성 업체의 사례 연구 및 본 연구에서 사용한 데이터 마이닝 기법들에 대한 세부적인 내용을 기술하였으며 연관규칙의 결과를 살펴보고 의미를 분석한다. 결론에서는 연구결과를 종합하고 미래의 연구방향을 제시하였다 N
가설 설정
첫째, 소유차종에 따른 고객의 성향은 무엇인가? 타겟 마케팅을 할 수 있는 유의한 변수는 무엇인가?
제안 방법
또한 SAS 를 이용하여 고객 data에서 변수 추출 및 정제작업을 실시하였다. 데이터 마이닝은 SAS 사의 데이터 마이닝툴인 Enterprise-Miner를 이용하여 연관규칙에 의한 고객 그룹 속성 및 고객 그룹에 대한 분류 및 유의한 연관 규칙을 제시하였다.
Association Rule 은 적절한 조건이 주어지지 않으면 적게는 몇 십개 에서 많게는 몇 만개 이상의 룰들이 생성되어 Association Rule°] 적절한 파라미터의 조건과 이에 맞는 변수들의 선정이 가장 중요한 문제이다. 따라서 본 알고리즘을 적용 하기전 선행된 분석에 맞는 변수들의 통계적인 수준을 분석하고 이에 맞는 변수들을 선정하여 Association Rule을 적용하였다. 생성된 각각의 룰들의 의미와 비교가 가능한 자동차 S사의 룰들을 비교하였고 생성된 룰들은 다음과 같다.
또한 CRMe 데이터 마이닝을 통해 고객데이터의 세분화를 실시하여 신규고객획득, 우수고객 유지, 고객가치증진, 잠재고객 활성화, 평생 고객화와 같은 사이클을 통하여 고객을 적극적으로 관리하고 유도하며 고객의 가치를 극대화 시킬 수 있는 전략을 통하여 마케팅을 실시한다. 이러한 CRM의 정의로 볼 때 CRM에서의 데이터 마이닝은 필수 불가결한 도구라고 볼 수 있다
실제 데이터를 중심으로 연구하였다. 또한 SAS 를 이용하여 고객 data에서 변수 추출 및 정제작업을 실시하였다. 데이터 마이닝은 SAS 사의 데이터 마이닝툴인 Enterprise-Miner를 이용하여 연관규칙에 의한 고객 그룹 속성 및 고객 그룹에 대한 분류 및 유의한 연관 규칙을 제시하였다.
고객의 유지가 중요한 과제가 되고 있다[19]. 본 논문에서는 국내의 완성자동차 구매 고객을 대상으로 데이터 마이닝을 위한 기법 중 연관규칙 이용하여 기존고객을 분석하였고 그 결과는 다음과 같다.
본 논문의 구성은 I장 서론 에서는 연구 목적, 연구범위와 방법을 제시, 데이터 마이닝의 개념과 CRM, 데이터 마이닝 응용분야 등을 살펴보고. 본론에서는 자동차 완성 업체의 사례 연구 및 본 연구에서 사용한 데이터 마이닝 기법들에 대한 세부적인 내용을 기술하였으며 연관규칙의 결과를 살펴보고 의미를 분석한다.
본 연구에서는 국내 완성자동차 업체인 A사의 자료를 입수하여 연구하였고 수행하는 연구의 진행 절차는 데이터 마이닝 프로세스의 각 단계별 과정에 따라 진행을 하고자 하며 과정은 첫째 고객자료 수집 및 통합, 둘째 수집 자료에 대한 추출 및 정제 작업, 셋째 변수의 선정, 넷째, 분류에 의한 고객 그룹속성 분석 및 고객그룹에 대한 연관규칙의 분석의 순서로 진행 되었다.
셋째, 잠재 자동차 구매 고객의 만족도를 통한 재 구매 고객 선별로 문제를 정의 하였다.
잠재 및 신규고객, 재 고입 잠재고객 그룹의 선별의 측면에서 적용된 변수들을 살펴보면 제조회사, 차명, 배기량, 차종, 구매비교차종, 마지막고려차종, 구입이유, 만족도, 좋은점, 재구입, 재구입이유, 성별, 연령, 가족 형태, 직업 직급, 회사규모, 가족수, 맞벌이, 월소득, 가족 총소득, 생활비를 적용하였고 Confidence 60%<, Support Mean 20%< 의 유의한 룰들을 정리하면 다음과 같다.
잠재 자동차 구매 고객의 만족도를 통한 재 구매 고객 선별의 적용문제에서 적용된 변수를 살펴보면 제조회사, 차명, 배기량, 차종, 구매비교차종, 마지막 고려 차종, 구입이유, 만족도, 좋은점, 재구입, 재구입이유, 성별, 연령, 가족형태, 직업, 직급, 회사규모, 가족수, 맞벌이, 월소득, 가족총소득, 생활비를 적용하였고 유의한 룰들을 정리하면 다음과 같다.
첫째, 데이터 마이닝에 의한 고객분석 결과 타겟마케팅 측면에서의 고객 성향 분석을 통하여 몇가지 유의 한결 과를 살펴볼 수 있었다. 이는 완성자동차 업계는 자동차 구입고객중의 대다수가 신문을 구독함을 알 수 있었고 정치면이나 경제면을 활용하면 보다 낳은 마케팅 효과를 보임을 입증하였다.
반면 무응답의 경우도 일정한 패턴의 규칙성을 가질 수 있고, 의미 있는 결과를 가질 수도 있지만 분석에서는 일괄적으로 무응답인 경우는 룰 생성에서 제외하였다. 최초 원시데이터로부터 고객의 기본정보의 데이터 셋 (background), 고객 성향들의 유의한 값을 가진 변수들의 집합, 그리고 이 두 데이터들을 합한 데이터를 최종연관규칙 데이터 마이닝 모델에 적용하였다.
타겟마케팅 측면에서 적용변수를 살펴보면 성별, 연령, 본인의 가족위치, 가족형태, 직업, 직급, 회사규모, 집소유, 가족수, 결혼, 맞벌이, 신문구독, 정기신문구독, 자주 읽는 신문, 일요일 신문 보는 시간, 즐겨 보는 순서, 소유차량가격, 월 소득, 가족총소득, 생활비 를 적용하였고, Confidence 60%<, Support Mean 20%< 의 유의한 룰들을 정리하면 다음과 같다.
대상 데이터
데이터를 이루고 있는 고객의 수는 3, 159명으로 총 고객에서 샘플링을 하여 선정하였고, 조사 결과중 null 값은 평균값으로 일괄 처리, 또는 데이터 마이닝 알고리즘에 적합한 값으로 변환 하였다. 따라서 대체평균값이나, 기타 값들에 의해서 축출된 데이터 마이닝룰은 분석/해석 대상에서 제외를 하였다.
본 연구에서 사용한 데이터는 국내 완성형자동차 업체의 샘플자료로써 소비자구매 행동에 대한 일반적인데 이 터 즉 구매시 자동차 비교 여부, 구매시 비교차종, 비교사유, 현소유차 구매 사유 등이며, 자동차에 대한만족도를 위한 항목은 전반적인 만족도, 소유차 제조회사 이미지 개선도, 이미지 적합도, 개인 속성별 만족도, 연비/유지비 평가 등이고 재구매 측정을 위한 항목은 소유차 재구매 의도, 소유차 제조회사 재구매 의도로 구성되었으며 과거 200X년 9월부터 10월까지 발생한 신차 구입자를 대상으로 이루어진 설문을 대상으로 하였다. 데이터를 이루고 있는 고객의 수는 3, 159명으로 총 고객에서 샘플링을 하여 선정하였고, 조사 결과중 null 값은 평균값으로 일괄 처리, 또는 데이터 마이닝 알고리즘에 적합한 값으로 변환 하였다.
데이터처리
잠정적으로 선택된 많은 변수 중에서 원하는 모형에 가장 적합한 변수를 선정해야 하는데 선정방법에는 대표적으로 입력변수와 목표변수간의 결정계수를 이용하는 방법과 카이제곱 통계량을 이용하는 방법이 있대 1]. 또한 기초통계 분석을 함으로써 원시데이터 변수들 중 유의한 변수들을 정의하고 효과적이고 이상적인 마이닝 분석 결과를 얻기 위한 과정으로서 주로 분석한 통계분석은 mean, freq, correlation, ttest, cronbachs alpha 등을 분석하였다.
이론/모형
연관성 규칙은 한 항목 그룹과 다른 항목 그룹 사이에 존재하는 강한 연관성을 찾아내는 마이닝 기법으로 적용된 연관규칙은 Agrawal의 Apriori 알고리즘을 사용하였고 implication의 형태로 표현되고 표현식은 다음과 같다.
성능/효과
가계소득에 관한 평균값을 살표 보면 평균 328만 원가량의 총 가계소득을 살펴볼 수 있고, 평균연령은 30 대, 20대의 순으로 조사되었고, 가족수는 4명의 가족 구성원이 가능 높은 평균값의 분포를 보였으며 직업으로는 전문직, 공무원, 자영업/회사원의 순으로 조사되었다. 평균값중 특이 한 사항은 차량구입자중 전체 3159명 중 신문을 구독하는 구성이 2, 447(78%) 임을 알 수 있다.
특정한 고객과 집단의 세분화와 가치의 극대화는 타겟마케팅의 캠패인의 목표가 될 수 있다. 둘째, 고객 세분화와 신규 자동차 구매간의 관계에 대한 더 나은 이해로 교차 판매의 효율이 증대 될 수 있다. 셋째, 언제 그리고 왜 고객들이 이탈을 하는지, 그리고 어떤 경우에 긴급한 대처 방안은 무엇인지에 대한 개념 파악으로 우수고객의 유지율의 향상을 도모 할 수 있다.
이는 완성자동차 업계는 자동차 구입고객중의 대다수가 신문을 구독함을 알 수 있었고 정치면이나 경제면을 활용하면 보다 낳은 마케팅 효과를 보임을 입증하였다. 둘째, 잠재 신규고객, 재 구입잠재고객 그룹의선별의 문제에서는 A사의차를 소유하고 있는 고객들이 구매전 비교차종이 더 많다는 유의한 연관규칙을 발견하였고, A사는 잠재고객을 대상으로 좀 더 면밀한 경쟁사와의 비교에서 우위를 차지 할 수 있는 부분을 마케팅 한다면 좋은 데이터 마이닝 모델의 활용을 할 수 있다고 판단된다. 셋째, 잠재 자동차 구매고객의 만족도를 통한 재구매 고객의 선별의 문제에서는 특정 자동차 회사의 소유차 만족도가 높은 고객을 대상으로 마케팅 한다면 신규 고객의 유치 보다 유리한 마케팅을 할 수 있는 유의한 규칙이라고 판단된다.
앞서 언급한 이유 이외에도 CRM 또는 마이닝에 대한 해석은 고객의 거래 데이터에 대한 분석이 주를 이루고 있고, 또한 고객의 성향을 알 수 있는 데이터들이 부족해서 알고리즘 적용시 특별한 룰들을 얻어내기가 어렵다. 따라서 제한 조건을 벗어난 데이터 마이닝의 문제점들을 도출한 결과 Association Rule을 통한 고객의 성향 분석, 전체적인 데이터의 성격들의 결과를 도출할 수 있었다.
둘째, 고객 세분화와 신규 자동차 구매간의 관계에 대한 더 나은 이해로 교차 판매의 효율이 증대 될 수 있다. 셋째, 언제 그리고 왜 고객들이 이탈을 하는지, 그리고 어떤 경우에 긴급한 대처 방안은 무엇인지에 대한 개념 파악으로 우수고객의 유지율의 향상을 도모 할 수 있다. 이러한 요약된 개념들은 데이터 마이닝 또는 분석적 CRM 의 기법에서 얻어진 결과로서 운영 CRM에 의해 활용 될 수 있대 15].
둘째, 잠재 신규고객, 재 구입잠재고객 그룹의선별의 문제에서는 A사의차를 소유하고 있는 고객들이 구매전 비교차종이 더 많다는 유의한 연관규칙을 발견하였고, A사는 잠재고객을 대상으로 좀 더 면밀한 경쟁사와의 비교에서 우위를 차지 할 수 있는 부분을 마케팅 한다면 좋은 데이터 마이닝 모델의 활용을 할 수 있다고 판단된다. 셋째, 잠재 자동차 구매고객의 만족도를 통한 재구매 고객의 선별의 문제에서는 특정 자동차 회사의 소유차 만족도가 높은 고객을 대상으로 마케팅 한다면 신규 고객의 유치 보다 유리한 마케팅을 할 수 있는 유의한 규칙이라고 판단된다. 추후 연구과제로는 다수의 변수 중에서 고객의 특정 속성을 인공신경망에 적용함으로써 우수, 비우수 고객의 유형의 추출 및 입력 변수가 단순화 됨으로써 모형을 쉽게 파악라고 우수고객과 비우수고객을 구분함으로써보다 효율적인 마케팅 전략의 수립이 가능할 수 있도록 세부적인 분석이 필요하다.
위의 결과를 해석하면 현재 소유차에 대한 만족도가 만족이라고 대답한 사람과 재 구매의사라고 한 남성 중 A사차를 소유한 고객그룹 생성하면 그 그룹의 사람들은 반드시 재구매 의사를 가지고 있다라고 해석 가능하다. 따라서 A차의 구매고객 중 현재 소유차의 만족도가 만족인 고객을 대상으로 타겟마케팅을 한다면 보다 좋은 매출 효과를 가져 올 수 있다.
첫째, 데이터 마이닝의 문제를 해결하는 가장 일반적인 5가지 (Regression, Association, C4.5, Episode, Sequence) 알고리즘이 있다. 이러한 각각의 알고리즘별로 데이터의 일정한 형식의 타입과 변수들이 필요한데, 현재 분석을 하기위해 소유하고 있는 로우 데이터의 특성을 살펴보면 고객의 의견이나 생각을 묻는 설문조사 형식의 자료들로서, 고객의 거래 데이터 변수들이 결여되어 있어 적용할 수 있는 알고리즘이 극히 제한적이다.
후속연구
분석방법과 사례들이 있다. 본 논문에서 제시하는 데이터 마이닝 분석자들이 새로운 모형을 구축하는데 소요되는 노력을 최소화 할 수 있고, 더 나아가 기존 고객 및 신규 고객관리에 측면에서 마케팅 자료로 활용될 수 있다.
알 수 있다. 이러한 고객들을 잠재고객으로 설정하고 지속적인 관리를 함으로써 다음 자동차 구입시 비교 대상 차종의 범주에서 좀더 유리한 결과를 가져 올 것으로 사료 된다.
하지만 자동차 산업은 한미 FTA 및 여러가지 어려운 글로벌한 시장과 더불어 자동차 생산 및 내수의 보급이 급격하게 증가 되고 있는 추세이고, 현재 우리나라 자동차 보급률은 IMF 외환위기 이전 150만대 수준이던 내수시장은 외환위기 이후 '02년 160만대 수준까지 증가하였으나 최근 고유가 등으로 인한 내수 시장 침체로 인하여 부진한 상황을 면치 못하고 있다. 이에 본 논문은 데이터 마이닝을 통한 고객 분석을 통하여 자동차 산업의 고객 마케팅의 좋은 분석 방법으로 활용하기를 기대한다.
생산국이다. 최근 글로벌 경쟁 심화와 업계 판도의 변화, 시장구조의 변화가 예상되지만 향후 내수는 경기둔화, 고용불안정, 고유가 지속등의 요인들이 크게 개선되기 어려울 것으로 보이나, 차량 노후화에 따른 대체 수요 발생, 신차 효과등이 긍정적인 요인으로 작용할 것으로 예상된다. 하지만 자동차 산업은 한미 FTA 및 여러가지 어려운 글로벌한 시장과 더불어 자동차 생산 및 내수의 보급이 급격하게 증가 되고 있는 추세이고, 현재 우리나라 자동차 보급률은 IMF 외환위기 이전 150만대 수준이던 내수시장은 외환위기 이후 '02년 160만대 수준까지 증가하였으나 최근 고유가 등으로 인한 내수 시장 침체로 인하여 부진한 상황을 면치 못하고 있다.
셋째, 잠재 자동차 구매고객의 만족도를 통한 재구매 고객의 선별의 문제에서는 특정 자동차 회사의 소유차 만족도가 높은 고객을 대상으로 마케팅 한다면 신규 고객의 유치 보다 유리한 마케팅을 할 수 있는 유의한 규칙이라고 판단된다. 추후 연구과제로는 다수의 변수 중에서 고객의 특정 속성을 인공신경망에 적용함으로써 우수, 비우수 고객의 유형의 추출 및 입력 변수가 단순화 됨으로써 모형을 쉽게 파악라고 우수고객과 비우수고객을 구분함으로써보다 효율적인 마케팅 전략의 수립이 가능할 수 있도록 세부적인 분석이 필요하다.
참고문헌 (27)
강현철, 한상태, 최종후, 데이터 마이닝 방법론 및 활용, 자유아카데미, 1999.
김영만, "통신서비스 시장에서 데이터 마이닝을 이용한 이탈고객 분석", 한국과학기술원, 석사학위논문, 1999.
김정수, 통합 데이터베이스 마케팅 시스템, 범우사, 1997.
노상규, "데이터 마이닝 기법을 이용한 인공 신경 망 입력변수 선정에 관한 연구", 서울대학교대학원, 석사학위논문, 1999.
박종덕, 지태창, "데이터 마이닝 수행절차에 관한 연구", LG-EDS 시스템 기술연구부문 연구개발팀, 1999.
B. A. Jain and B. N. Nag, "Performance Evaluation of Neural Network Decision Models," Journal of Management Information Systems, Vol.14, pp.201-216, 1997.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.