일반적으로 데이터 마이닝은 다양한 예측기법이나 차이점의 분석을 통하여 유용한 정보 도출을 통해 매출의 증대나, 비용 절감 등의 효과를 가져 올수 있다. 데이터 마이닝 분석은 정보의 분류 또는 다양한 각도나 영역의 관점을 통하여 새로운 뷰를 분석할 수 있다. 기술적으로 데이터 마이닝의 연관규칙이나, 패턴의 분석은 대량의 데이터베이스에서 분석된다. 따라서 데이터 마이닝은 가장 빠르게 성장한 산업중의 하나이다. 그 이유는 정보기술이 발달하면서 수많은 자료들이 체계화된 데이터베이스에 저장이 되고, 기업의 데이터베이스의 규모는 폭발적으로 증가되고 있다. 본 논문에서는 자동차 마케팅에서 이용 가능한 데이터를 데이터 마이닝 분석 기법중의 하나인 Quinlan의 C4.5에 따라 분석 하였다. 본 논문에서는 기존 고객에 대한 고객 속성파악, 고객 분류 및 분석에 따른 고객의 구매패턴을 분석하여 해당 기업의 전략적 마케팅 수립을 통해 경영 과학적으로 접근할 수 있는 데이터 마이닝 분석에 관한 사례 연구이다.
일반적으로 데이터 마이닝은 다양한 예측기법이나 차이점의 분석을 통하여 유용한 정보 도출을 통해 매출의 증대나, 비용 절감 등의 효과를 가져 올수 있다. 데이터 마이닝 분석은 정보의 분류 또는 다양한 각도나 영역의 관점을 통하여 새로운 뷰를 분석할 수 있다. 기술적으로 데이터 마이닝의 연관규칙이나, 패턴의 분석은 대량의 데이터베이스에서 분석된다. 따라서 데이터 마이닝은 가장 빠르게 성장한 산업중의 하나이다. 그 이유는 정보기술이 발달하면서 수많은 자료들이 체계화된 데이터베이스에 저장이 되고, 기업의 데이터베이스의 규모는 폭발적으로 증가되고 있다. 본 논문에서는 자동차 마케팅에서 이용 가능한 데이터를 데이터 마이닝 분석 기법중의 하나인 Quinlan의 C4.5에 따라 분석 하였다. 본 논문에서는 기존 고객에 대한 고객 속성파악, 고객 분류 및 분석에 따른 고객의 구매패턴을 분석하여 해당 기업의 전략적 마케팅 수립을 통해 경영 과학적으로 접근할 수 있는 데이터 마이닝 분석에 관한 사례 연구이다.
Generally, data mining is the process of analyzing data from different perspectives and summarizing it into useful information that can be used to increase revenue, cuts costs, or both. It allows users to analyze data from many different dimensions or angles, categorize it, and summarize the relatio...
Generally, data mining is the process of analyzing data from different perspectives and summarizing it into useful information that can be used to increase revenue, cuts costs, or both. It allows users to analyze data from many different dimensions or angles, categorize it, and summarize the relationships identified. Technically, data mining is the process of finding correlations or patterns among dozens of fields in large relational databases. Data mining is one of the fastest growing field in the computer industry. Because of According to computer technology has been improving, Massive customer data has stored in database. Using this massive data, decision maker can extract the useful information to make a valuable plan with data mining. Data mining offers service providers great opportunities to get closer to customer. Data mining doesn't always require the latest technology, but it does require a magic eye that looks beyond the obvious to find and use the hidden knowledge to drive marketing strategies. Automotive market face an explosion of data arising from customer but a rate of increasing customer is getting lower. therefore, we need to determine which customer are profitable clients whom you wish to hold. This paper builds model of customer loyalty detection and analyzes customer buying patterns in automotive market with data mining using decision tree as a quinlan C4.5 and basic statics methods.
Generally, data mining is the process of analyzing data from different perspectives and summarizing it into useful information that can be used to increase revenue, cuts costs, or both. It allows users to analyze data from many different dimensions or angles, categorize it, and summarize the relationships identified. Technically, data mining is the process of finding correlations or patterns among dozens of fields in large relational databases. Data mining is one of the fastest growing field in the computer industry. Because of According to computer technology has been improving, Massive customer data has stored in database. Using this massive data, decision maker can extract the useful information to make a valuable plan with data mining. Data mining offers service providers great opportunities to get closer to customer. Data mining doesn't always require the latest technology, but it does require a magic eye that looks beyond the obvious to find and use the hidden knowledge to drive marketing strategies. Automotive market face an explosion of data arising from customer but a rate of increasing customer is getting lower. therefore, we need to determine which customer are profitable clients whom you wish to hold. This paper builds model of customer loyalty detection and analyzes customer buying patterns in automotive market with data mining using decision tree as a quinlan C4.5 and basic statics methods.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
5을 이용하여 기존고객을 세분화한 다음 분류고객의 특성에 맞는 마케팅 프로모션을 하게하고 신규고객을 획득할 때는 신규고객의 특성을 미리 예측하여 분류함으로써 고객의 평생가치(Life Tine Value)를 촉진하여 기업과 고객과의 관계성을 높여서 기업은 안정된 고객층으로부터 수익을 창출하고 고객들은 해당 기업으로부터 더 많은 혜택을 받게 하는데 목적이 있다. 그러므로 본 논문에서 제시하고자 하는 것은 기존 구매 고객에 대한 분류규칙, 및 고객속성 파악, 기존 고객 분류에 따른 신규고객의 분류 예측 두 가지를 수행하여 해당 기업의 마케팅 전략수립에서부터 경영 과학적으로 접근할 수 있는 데이터마이닝 분석 방법을 제시 하고자 한다[1].
본 논문에서는 데이터마이닝 방법론 중의 하나인 Quinlane 의사결정 트리 C4.5을 이용하여 기존고객을 세분화한 다음 분류고객의 특성에 맞는 마케팅 프로모션을 하게하고 신규고객을 획득할 때는 신규고객의 특성을 미리 예측하여 분류함으로써 고객의 평생가치(Life Tine Value)를 촉진하여 기업과 고객과의 관계성을 높여서 기업은 안정된 고객층으로부터 수익을 창출하고 고객들은 해당 기업으로부터 더 많은 혜택을 받게 하는데 목적이 있다. 그러므로 본 논문에서 제시하고자 하는 것은 기존 구매 고객에 대한 분류규칙, 및 고객속성 파악, 기존 고객 분류에 따른 신규고객의 분류 예측 두 가지를 수행하여 해당 기업의 마케팅 전략수립에서부터 경영 과학적으로 접근할 수 있는 데이터마이닝 분석 방법을 제시 하고자 한다[1].
본 논문에서는 이러한 데이터 마이닝의 기술을 이용해완성자동차 업체의 설문데이터를 토대로 자동차 구매 고객의 패턴을 분석하고자 한다. 2002년 이후 수출이 큰폭의 증가세를 유지, 이는 국산차의 제품경쟁력 향상과 브랜드 인지도의 상승, 업계의 적극적인 수출시장 개척에따른 결과이며, 최근 3~4년간 내수 부분에서의 부진이지속되고 있는 것은 고유가로 인한 차량 유지비의 상승, 경기부진에 따른 소비심리위축, 고용불안정 등의 요인을반영으로 반영되고 있다.
가설 설정
어떤 차량을 구입하는가? 둘째, 경소형차와 소형차 구매고객은 어떤 유의한 패턴의 차이를 보이는가? 의문제를 정의 하였고, 분석의 과정에서 특이하게 도출된타겟변수들을 재선정하여 세부적인 분류 규칙을 분석 하였다.
제안 방법
하였다. 고객에서 샘플링을 하여 선정하였고, 조사 결과 중 null 값은 평균값으로 일괄 처리, 또는 데이터 마이닝 알고리즘에 적합한 값으로 변환 하였다. 따라서 대체 평균값이나, 기타 값들에 의해서 축출된 데이터 마이닝 룰은 분석/해석 대상에서 제외를 하였다.
국내 완성자동차 업체인 A사의 자료를 입수하여 연구하였고 수행하는 연구의 진행절차는 데이터 마이닝 프로세스의 각 단계별 과정에 따라 진행을 하고자 하며 과정은 첫째 고객자료 수집 및 통합, 둘째 수집 자료에 대한추출 및 정제 작업, 셋째 변수의 선정, 넷째, 분류에 의한고객 그룹속성 분석 및 고객그룹에 대한 분류규칙의 분석 순서로 진행 되었다.
5의 Parameters들의 적절한 조건이 주어지지 않으면 적게는 몇 개에서 많게는 몇 십개 이상의 파생변수 들이 생성되어 의사결정트리의 적절한 파라미터의 조건과 이에 맞는 변수들의 선정이 가장 중요한 문제이다. 따라서 본 알고리즘을 적용 하기전 선행된 분석에 맞는 변수들의 통계적인 수준을 분석하고 이에 맞는 변수들을 선정하여 의사결정트리에 적용하였다.
따라서 좀더 세부적인 분석을 위해서 분류타겟을 좀더세분화 하여 종속변수를 대형, 중형으로 구분하여 분석을 하였다. [표 4]은 종속변수를 "대형”으로 설정하여 분석하였다.
이에 마케팅의 측면에서 고객전략을 정의하고, 경영자원의 분배를 최적화하며, 고객과 관련된 모든 부분에서 최상의 서비스를 제공하기 위해, 고객의 욕구와 행동, 고객의 수익성을 규명해 가는, 지속적이고 자동화된 프로세스로서 CRMe 고객과 관련된 기업의 내외부 자료를 분석, 통합하여 고객특성에 기초한마케팅활동을 계획하고, 지원하며, 평가하는 과정이다. 또한 CRMe 데이터 마이닝을 통해 고객데이터의 세분화를 실시하여 신규고객획득, 우수고객 유지, 고객가치증진, 잠재고객 활성화, 평생 고객화와 같은 사이클을 통하여 고객을 적극적으로 관리하고 유도하며 고객의 가치를 극대화 시킬 수 있는 전략을 통하여 마케팅을 실시한다. 이러한CRM의 정의로 볼 때 CRM에서의 데이터 마이닝은 필수 불가결한 도구라고 볼 수 있다[7][8].
또한 기초통계 분석을 함으로써 원시데이터 변수들 중 유의한 변수들을 정의하고효과적이고 이상적인 마이닝 분석 결과를 얻기 위한 과정으로서 주로 분석한 통계분석은 평균값, 최빈값, 최소값, 최대값 등을 분석하였다. 또한 차종을 차량 급별로분류 하였다. 예를 들면 경소형, 소형, 준준형, 중형, RV, 스포츠, 기타 등으로 재분류 하였다.
유지가 중요한 과제가 되고 있다. 본 논문에서는 국내의 완성자동차 구매 고객을 대상으로 데이터 마이닝을 위한 기법 중 의사결정트리를 이용하여 기존 고객을 분류하였고 그 결과는 다음과 같다.
위의 분류규칙을 생성하기 위해서 의사결정트리 규칙을 적용하기 위해서 앞서 분석된 통계적인 유의한 변수들 중에 독립변수로는 성별, 연령, 가족형태, 직업, 가족 수, 결혼여부, 맞벌이 여부, 신문구독, 월소득이 사용되었고, 종속변수로는 문제정의의 분류 타겟인 차종에 대한 데이터로 정의 하였고, MINOBS의 수는 30, CF 0.25로 설정하였다.
위의 분류규칙을 생성하기 위해서 의사결정트리 규칙을 적용하기 위해서 앞서 분석된 통계적인 유의한 변수들중에 독립변수로는 성별, 연령, 가족형태, 직업, 가족수, 결혼여부, 맞벌이 여부, 신문구독, 월소득이 사용되었고, 종속변수로는 문제정의의 분류 타겟인 제조사에 다한 데이터로 정의 하였고, MINOBS의 수는 50, CF 0.25 로 설정하였다.
의문제를 정의 하였고, 분석의 과정에서 특이하게 도출된타겟변수들을 재선정하여 세부적인 분류 규칙을 분석 하였다.
첫째, 분류규칙에 의한 구매패턴 분석 결과 타겟마케팅 측면에서의 고객 성향 분석을 통하여 몇가지 유의한결과를 살펴볼 수 있었다. 첫째, 일반적인 매스미디어를통한 마케팅의 규칙에서 조금 벗어난 몇가지 구매 패턴 [8]을 정의할 수 있었다.
반면 무응답의 경우도 일정한 패턴의 규칙성을 가질 수 있고, 의미 있는 결과를 가질 수도 있지만 분석에서는 일괄적으로 무응답인 경우는 룰 생성에서 제외하였다. 최초 원시데이터로부터 고객의 기본정보의 데이터 셋, 고객 성향들의 유의한 값을 가진 변수들의 집합, 그리고 이 두 데이터들을 합한 데이터를 최종 분류규칙 데이터 마이닝 모델에 적용하였다.
이는 자녀의 성장, 독립과 발마추어 1가구 2차량의 가정이라고 분석되어진다. 표의 분석된 결과의 분류는 대부분 소형, 경소형 차량의로 분류규칙이 형성되어 경소형과 소형 차량을 독립변수로 설정하여 세부분석을 실시하였다.
대상 데이터
본 연구에서 사용한 데이터는 국내 완성형자동차 업체의 샘플자료로써 소비자구매 행동에 대한 일반적인 데이터 즉 구매시 자동차 비교 여부, 구매시 비교차종, 비교 사유, 현소유차 구매 사유 등이며, 자동차에 대한 만족도를 위한 항목은 전반적인 만족도, 소유차 제조회사 이미지 개선도, 이미지 적합도, 개인 속성별 만족도, 연비/유지비 평가 등이고 재구매 측정을 위한 항목은 소유차 재구매 의도, 소유차 제조회사 재구매 의도로 구성되었으며 과거 신차 구입자를 대상으로 이루어진 설문을 대상으로 하였다. 고객에서 샘플링을 하여 선정하였고, 조사 결과 중 null 값은 평균값으로 일괄 처리, 또는 데이터 마이닝 알고리즘에 적합한 값으로 변환 하였다.
데이터처리
잠정적으로 선택된 많은 변수 중에서 원하는 모형에 가장 적합한 변수를 선정해야 하는데 선정방법에는 대표적으로 입력변수와 목표변수간의 결정계수를 이용하는 방법과 카이제곱 통계량을 이용하는 방법이 있다[10]. 또한 기초통계 분석을 함으로써 원시데이터 변수들 중 유의한 변수들을 정의하고효과적이고 이상적인 마이닝 분석 결과를 얻기 위한 과정으로서 주로 분석한 통계분석은 평균값, 최빈값, 최소값, 최대값 등을 분석하였다. 또한 차종을 차량 급별로분류 하였다.
성능/효과
가계소득에 관한 평균값을 살펴보면 평균 328만원 가량의 총 가계소득을 살펴볼 수 있고, 평균연령은 30대 , 20대의 순으로 조사되었고, 가족수는 4명의 가족구성원이 가능 높은 평균값의 분포를 보였으며 직업으로는 전문직, 공무원, 자영업/회사원의 순으로 조사되었다.
특정한 고객과 집단의 분류와 가치의 극대화는 타겟 마케팅의 캠패인의 목표가 될 수 있다. 둘째, 고객 세분화와신규 자동차 구매간의 관계에 대한 더 나은 이해로 교차판매의 효율이 증대 될 수 있다. 이러한 요약된 개념들은데이터 마이닝 또는 분석적 CRM 의 기법에서 얻어진결과로서 운영 CRM에 의해 활용 될 수 있다[7].
예를 들면 중형차 구매의 패턴이신혼부부나, 주부집단에서도 매우 유의한 구매 패턴을도출할 수 있었고, 이는 새로운 마케팅에 대한 고객층을제시할 수 있었다. 둘째, 소형차, 경소형차의 구매패턴을살펴보면 전문직의 자녀성장기에 있는 그룹에서는 소형자동차의 구매 신뢰도가 상당히 유의하게 도출되었고, 경소형차의 구매 패턴에서도 44세 이상의 집단층에서 경소형차의 구입패턴이 유의하게 도출됨에 따라 소형자동차 시장에서 이런한 분류 규칙을 적용하여 판매를 증가할 수 있는 유의한 규칙이라고 사료된다.
앞서 언급한 이유 이외에도 CRM 또는 마이닝에 대한해석은 고객의 거래 데이터에 대한 분석이 주를 이루고있고, 또한 고객의 성향을 알 수 있는 데이터들이 부족해서 알고리즘 적용시 특별한 룰들을 얻어내기가 어렵다. 따라서 제한 조건을 벗어난 데이터 마이닝의 문제점들을도출한 결과 분류규칙을 통한 고객의 성향 분석, 전체적인 데이터의 성격들의 결과를 도출할 수 있었다.
82%의 신뢰도를 가지고 중형차 구입의 부류 규칙이 도출되었다. 또한 31세 이상의 신혼부부중 狈만원보다 적거나 같은 급여수준을 가지고 있는 집단에서 중형차를 구입하는 패턴을 발견할 수 있었다. 분석 결과를 요약하여 보면, 주부 집단이나, 신혼부부집단은 우리가 알고 있는 일반적인 소형차 위주의 구매패턴에서 벗어나 삶의 질이 고급화 되어가고 젊은 층의 의식변화에 따른 소형차 보다는 중형차의 구매 패턴을 반영한 결과라고 예측되고, 이러한 분석의 패턴을 기반으로 중형차 판매의 마케팅을 보다 새로운 계층, 신혼부부와 주부 등을 대상으로한 마케팅 활동도 보다 좋은 판매 전략이 될 것이라고 예측할 수 있다.
구입 가능성이 높음을 알 수 있다. 또한 맞벌이를 하지 않는 월소득 450만원이상인 고객 분류층에서는 대형차를 선호하는 것으로 분석되었고, 38세 이상의 연령대에서 대형차를 주로 구매하는 패턴을 분류할 수 있었다.
월소득 260만원 이상의 40대 이하의 주부 그룹에서 신뢰도 61.82%의 신뢰도를 가지고 중형차 구입의 부류 규칙이 도출되었다. 또한 31세 이상의 신혼부부중 狈만원보다 적거나 같은 급여수준을 가지고 있는 집단에서 중형차를 구입하는 패턴을 발견할 수 있었다.
첫째, 글로벌 경쟁 심화, 시장구조의 변화가 예상되고 이는 미국 빅3의 비중축소와 일본업체와 아시아 업체의 약진이 예상되며, 미국 유럽, 일본 등 선진시장의 비중축소와 중국, 인도, 러시아 등 신흥시장의 확대가 예상될 수 있다. 또한 최근 고유가의 지속으로 중대형차에서소형차로 무게중심이 상당폭 이동 예측이 가능하며 향후내수는 경기둔화, 고용불안정, 고유가의 지속 등의 요인들이 크게 개선되기 어려울 것으로 보이나 국산 자동차의 품질 및 브랜드 이미지 상승, 판매망 확대, 해외선진업체의 판매망 활용 등의 요인이 긍정적으로 작용할 것으로 예측할 수 있다.
후속연구
이러한 신경망 모형은 고객의 신용평가, 불량거래의 색출, 의료진단예측, 우량고객의 선정 타겟 마케팅의 여러 주제 등을 비롯한 다양한 분야에 적용될 수가 있는데, 주로 교사학습에 적용되어 목적변수(target)에 대한 예측이나 분류를 목적으로 감춰진 패턴을 찾고 이를 일반화하는데 이용된다. 따라서 본 논문의 데이터를 분석한 결과 목적변수를 기준으로 우량고객의 선정, 타겟 마케팅 등에 적용할 수 있다. 결과의 해석은 [그림 1]에 제시된 바와 같이 유의한 변수의 규칙에 의한 의사결정 모형의 트리구조로 해석될 수 있다.
첫째, 글로벌 경쟁 심화, 시장구조의 변화가 예상되고 이는 미국 빅3의 비중축소와 일본업체와 아시아 업체의 약진이 예상되며, 미국 유럽, 일본 등 선진시장의 비중축소와 중국, 인도, 러시아 등 신흥시장의 확대가 예상될 수 있다. 또한 최근 고유가의 지속으로 중대형차에서소형차로 무게중심이 상당폭 이동 예측이 가능하며 향후내수는 경기둔화, 고용불안정, 고유가의 지속 등의 요인들이 크게 개선되기 어려울 것으로 보이나 국산 자동차의 품질 및 브랜드 이미지 상승, 판매망 확대, 해외선진업체의 판매망 활용 등의 요인이 긍정적으로 작용할 것으로 예측할 수 있다. 이에 마케팅의 측면에서 고객전략을 정의하고, 경영자원의 분배를 최적화하며, 고객과 관련된 모든 부분에서 최상의 서비스를 제공하기 위해, 고객의 욕구와 행동, 고객의 수익성을 규명해 가는, 지속적이고 자동화된 프로세스로서 CRMe 고객과 관련된 기업의 내외부 자료를 분석, 통합하여 고객특성에 기초한마케팅활동을 계획하고, 지원하며, 평가하는 과정이다.
사례들이 있다. 본 논문에서 제시하는 데이터 마이닝은 분석자들이 새로운 모형을 구축하는데 소요되는 노력을 최소화 할 수 있고, 더 나아가 기존 고객 및신규 고객관리에 측면에서 마케팅 자료로 활용 될 수 있다.
또한 31세 이상의 신혼부부중 狈만원보다 적거나 같은 급여수준을 가지고 있는 집단에서 중형차를 구입하는 패턴을 발견할 수 있었다. 분석 결과를 요약하여 보면, 주부 집단이나, 신혼부부집단은 우리가 알고 있는 일반적인 소형차 위주의 구매패턴에서 벗어나 삶의 질이 고급화 되어가고 젊은 층의 의식변화에 따른 소형차 보다는 중형차의 구매 패턴을 반영한 결과라고 예측되고, 이러한 분석의 패턴을 기반으로 중형차 판매의 마케팅을 보다 새로운 계층, 신혼부부와 주부 등을 대상으로한 마케팅 활동도 보다 좋은 판매 전략이 될 것이라고 예측할 수 있다.
따라서 자동차 산업의 경쟁방식은 기존고객의 유지, 서비스의 차별화와 고도화를통해 이루어져야 하며 신규고객 1명 유치에 드는 비용은기존고객 1명을 유지하는데 드는 비용보다 4-6배 더 들게 되는 것을 감안한다면 양적 성장인 신규고객 유치보다는 보유고객에 대한 다각적인 분석에 따른 효율적인마케팅 방법 적용으로 심화되는 자동차 완성 업체간의경쟁에서 우위를 차지할 수 있을 것이대6]. 이에 본 논문은 데이터 마이닝을 통한 고객 분석을 통하여 자동차산업의 고객 마케팅의 좋은 분석 방법으로 활용하기를기대 한다.
최근 미국의 빅3 자동차 상의 부도설과 더불어 내수 경기의 침체, 유가의 급등으로 인한 여러가지 사회적인 외면할 수 있는 요인들이 발생함에 따라 추후 연구과제로는 사회적인 경제 지표 요인, 즉 유가, 환율 등 대외적인 경제 지표를 반영하여 보다 낳은 다수의 변수 중에서 고객의 특정 속성과의 상관관계 모형을 구축함으로써 구매고객 분류 및 패턴과 사회요인의 역학적인 모형을 수립하여 좀 더 효율적이고 효과적인 마케팅 전략의 수립이 가능할 수 있도록 세부적인 연구 모델의 수립이 필요하다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.