[논문]토픽 분석을 활용한 관심 기반 고객 세분화 방법론

현윤진; 김남규; 조윤호

doi:10.21219/jitam.2015.22.1.077

토픽 분석을 활용한 관심 기반 고객 세분화 방법론
Interest-based Customer Segmentation Methodology Using Topic Modeling 원문보기

Journal of information technology applications & management = 한국데이타베이스학회지, v.22 no.1, 2015년, pp.77 - 93

현윤진 (국민대학교 비즈니스IT전문대학원) , 김남규 (국민대학교 경영정보학부) , 조윤호 (국민대학교 경영학부)

Abstract ▼ AI-Helper

As the range of the customer choice becomes more diverse, the average life span of companies' products and services is becoming shorter. Most companies are striving to maximize the revenue by understanding the customer's needs and providing customized products and services. However, companies had to bear a significant burden, in terms of the time and cost involved in the process of determining each individual customer's needs. Therefore, an alternative method is employed that involves grouping the customers into different categories based on certain criteria and establishing a marketing strategy tailored for each group. In this way, customer segmentation and customer clustering are performed using demographic information and behavioral information. Demographic information included sex, age, income level, and etc., while behavioral information was usually identified indirectly through customers' purchase history and search history. However, there is a limitation regarding companies' customer behavioral information, because the information is usually obtained through the limited data provided by a customer on a company's website. This is because the pattern indicated when a customer accesses a particular site might not be representative of the general tendency of that customer. Therefore, in this study, rather than the pattern indicated through a particular site, a customer's interest is identified using that customer's access record pertaining to external news. Hence, by utilizing this method, we proposed a methodology to perform customer segmentation. In addition, by extracting the main issues through a topic analysis covering approximately 3,000 Internet news articles, the actual experiment applying customer segmentation is performed and the applicability of the proposed methodology is analyzed.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

Module 3의 포털사이트 검색 키워드 기반 고객 클러스터링 역시 본 연구에서 새롭게 제시하는 방안이다. Module 2가 이미 게시된 뉴스의 조회를 통해 고객의 관심을 간접적으로 파악하는 방법이라면, Module 3은 사용자가 직접 입력한 키워드를 통해 고객의 관심을 파악한다는 점에서 더욱 직접적인 방법이라고 할 수 있다.
하지만 고객 개개인의 니즈(Needs)를 파악하는 것은 많은 어려움이 따를 뿐 아니라 시간과 비용이 지나치게 많이 소비되기 때문에, 이에 대한 대안으로 고객 세분화 즉 고객 클러스터링을 수행하게 된다. 고객 클러스터링의 본질적인 목적은 고객을 동질적인 특성을 가진 집단으로 나누어 보다 손쉽게 고객의 니즈를 파악해 차별화된 마케팅 전략을 수립하는 데에 있다. 기존의 고객 클러스터링은 일반적으로 성별, 연령, 소득 등의 단순하면서도 범용적인 정보, 즉 원시적 형태의 인구통계학 정보를 활용하여 수행되어 왔으며, 최근에는 각 기업들이 보유하고 있는 고객의 구매 내역, 검색 내역 등의 고객 행태 정보를 고객 클러스터링에 활용하고 있다[고은주 외, 2005; 이건창, 정남호, 2003; 진서훈, 2005].
따라서 본 연구에서는 고객이 특정 사이트 내에 진입한 이후에 보이는 한정된 정보만을 기준으로 활용하는 기존의 고객 세분화와 달리, 고객의 실제 관심에 기반한 고객 세분화를 수행할 수 있는 방안을 제시하고자 한다. 구체적으로는 고객이 평소 조회한 뉴스 기사에 대해 토픽 분석을 수행하고, 이를 통해 파악된 각 고객의 관심 분야를 고객 세분화에 활용하고자 한다.
최근에는 많은 기업들이 고객의 인구통계학 정보뿐 아니라 고객의 구매 이력, 접속 패턴 등 다양한 정보를 활용하여 고객 세분화를 수행하고 있지만, 이들 정보의 대부분은 고객이 해당 사이트 내에서 보이는 특성을 나타낼 뿐 고객의 평소 성향 및 관심을 나타내기는 어렵다는 한계를 갖는다. 따라서 본 연구에서는 고객의 평소 인터넷 뉴스 조회 기록에 대한 텍스트 분석을 통해 고객의 실제 관심 분야를 식별하고, 이를 바탕으로 고객을 세분화할 수 있는 방안을 제시하였다. 또한 본 연구에서는 제안 방법론의 실제 적용 가능성을 평가하기 위해 인터넷 사용자 414명 및 이들이 조회한 뉴스 기사 약 3,000건에 대한 텍스트 분석을 수행하고, 그 결과 관심 기반 클러스터링을 통해 인구통계학 정보 기반 클러스터링과는 전혀 다른 고객군을 식별할 수 있음을 확인하였다.
따라서 본 연구에서는 고객이 특정 사이트 내에 진입한 이후에 보이는 한정된 정보만을 기준으로 활용하는 기존의 고객 세분화와 달리, 고객의 실제 관심에 기반한 고객 세분화를 수행할 수 있는 방안을 제시하고자 한다. 구체적으로는 고객이 평소 조회한 뉴스 기사에 대해 토픽 분석을 수행하고, 이를 통해 파악된 각 고객의 관심 분야를 고객 세분화에 활용하고자 한다.
또한 Module 3의 경우, 고객이 입력한 키워드를 그대로 문서로 정의하고 별도의 정제과정을 거치지 않았기 때문에 토픽분석 자체의 품질이 좋지 않게 나타났다. 따라서 본 절에서는 Module 1과 Module 2의 결과로 도출된 클러스터의 상이성을 확인하고자 한다.
동일한 기준을 사용한 클러스터링의 경우 클러스터 내 동질성 및 클러스터간 이질성을 측정하여 성능 비교가 가능하지만, Module 1～Module 3은 서로 상이한 기준을 사용하여 클러스터링을 수행하였기 때문에 성능 비교가 용이하지 않다. 따라서 본 절에서는 클러스터링의 성능 비교가 아닌 결과의 상이성만을 확인하고자 한다. 또한 Module 3의 경우, 고객이 입력한 키워드를 그대로 문서로 정의하고 별도의 정제과정을 거치지 않았기 때문에 토픽분석 자체의 품질이 좋지 않게 나타났다.
제안 방법론은 (1) 인구통계학 정보 기반의 고객 클러스터링(Module 1), (2) 뉴스 접속 기록 기반의 고객 클러스터링(Module 2), 그리고 (3) 포털사이트 검색 키워드 기반의 고객 클러스터링(Module 3)의 세 부분으로 구성되어 있다. 본 연구의 핵심은 고객이 방문한 인터넷 뉴스 기사에 대한 토픽 분석을 통해 고객의 실제 관심을 파악하고 이를 기반으로 고객 클러스터링을 수행하는 것이며, 이는 Module 2에 나타나 있다. Module 1과 Module 3은 클러스터링 기준에 따라 고객 세분화 결과가 상이하게 나타남을 보여주기 위해 부가적으로 수행된다.
본 절에서는 토픽 분석을 활용한 관심 기반 고객 세분화 방법론을 구체적으로 제시한다. <그림 3>은 본 연구에서 제안하는 방법론의 전체 구조를 보여주고 있으며, 실험 데이터는 원통형으로, 각 단계를 구성하는 세부 프로세스는 사각형으로 표시되어 있다.

제안 방법

Module 2의 경우에는 각각 “정치”, “스마트폰”, “연예인”이라는 서로 다른 토픽에 의해 그룹이 형성된 Cluster 4, Cluster 5, 그리고 Cluster 9()의 3개의 클러스터 간 인구통계 비율을 비교해 보았다.
고객의 인터넷 뉴스 기사 접속 기록을 분석하여 고객과 뉴스 기사 간 대응 매트릭스를 도출한 후, 앞서 도출된 뉴스 기사와 토픽 간 대응 매트릭스와 병합하여 고객과 토픽 간 대응 매트릭스를 도출한다. <그림 4>는 <표 2>의 예를 활용한 매트릭스 병합 과정의 예를 보여주고 있다.
토픽 분석은 유사한 주제를 갖는 문서들을 묶어서 하나의 토픽으로 구성한다는 점에서는 전통적인 군집화와 유사한 특성을 갖지만, 하나의 문서가 다수의 토픽에 대응될 수 있다는 점에서 기존의 군집화와 차별성을 갖는다. 본 논문에서는 토픽 분석과 기존의 군집화 방법을 모두 활용하여, 토픽 분석의 결과를 기반으로 고객 클러스터링을 수행한다.
우선 Module 1의 경우, 대표적인 클러스터로 Cluster 2와 Cluster 4의 인구통계 비율을 비교해 보았다. <그림 8>과 <그림 9>를 보면 Cluster 2의 경우, 여성이 100%, 미혼자가 80%를 차지하는 것에 반해, Cluster 4의 경우에는 남성이 79%, 기혼자가 100%를 차지하는 것을 알 수 있다.
Module 2의 뉴스 접속 기록 기반 고객 클러스터링은 본 연구에서 새롭게 제시하는 방법으로, 고객의 뉴스 기사 접속 기록을 분석하여 각 고객이 관심을 갖는 뉴스 토픽을 기반으로 고객을 그룹화한다. 우선, Web Transaction에서 인터넷 뉴스 사이트 접속 기록을 추출하여 크롤링을 통해 해당 News Articles를 수집한 후, 토픽 분석을 수행함으로써 다수의 토픽을 추출함과 동시에 뉴스 기사와 토픽 간 대응 매트릭스를 도출하게 된다. <표 2>는 토픽 분석으로 추출된 가상의 토픽을 보여주고 있다.
위의 과정을 통해 도출된 50개의 토픽에 근거하여 기사와 토픽 간 대응 매트릭스()를 구축한 후, 고객의 인터넷 포털사이트 뉴스 접속 기록을 분석하여 고객과 기사 간 대응 매트릭스( 참조)를 도출하였다.
1에서 K-평균 군집화를 통해 전통적 방식의 인구통계학 정보 기반의 클러스터링을 수행하였다. 이 때, 각 클러스터링에 대해 최적 클러스터의 수를 분석 도구에 의해 추천 받는 대신, 반복 실험에 기반한 연구자의 판단을 통해 고객 그룹의 수를 20개씩으로 통일하였다. 이에 따른 Module 1의 인구통계학 정보 기반의 고객 클러스터링 결과가 <표 5>에 나타나있다.
이 때, 고객마다 접속한 뉴스 기사의 수가 모두 다르기 때문에 고객별로 표준화를 수행하여 표준화된 고객과 토픽 간 대응 매트릭스를 도출한 후(), 뉴스 접속 기록 기반의 고객 클러스터링을 수행하여 총 20개의 고객 그룹을 도출하였다()
포털사이트 검색 키워드 기반의 고객 클러스터링인 Module 3의 경우, ⑥ Search Keywords Extraction 단계에서 고객이 포털 사이트에서 검색한 키워드를 모두 추출한 후, ⑦ Keywords Documentation 단계에서는 검색어들을 각 고객별로 통합하여, 고객별로 하나의 키워드 문서를 생성한다. 이렇게 구성된 키워드 문서들에 대해 ⑧ Topic Analysis를 수행하여 다수의 토픽을 추출한 후, 사용자와 토픽간의 대응 매트릭스를 도출하여 ⑨ User Clustering 단계에서 검색 키워드 기반의 고객 클러스터링을 수행하게 된다. 이후 절에서는 Module 1～Module 3의 세부 과정에 대한 자세한 내용을 소개한다.
이렇게 도출된 두 가지 매트릭스를 병합하여 고객과 토픽 간 대응 매트릭스를 도출하였다().
이에 대해 토픽 분석을 수행하여 총 50개의 토픽을 추출하였고(), 이에 근거하여 고객과 토픽 간 대응 매트릭스를 도출하였다.
이후 Module 2와 같은 방식으로 고객별 표준화를 수행하여 표준화된 고객과 토픽 간 대응 매트릭스를 도출한 후, 포털사이트 검색 키워드 기반의 고객 클러스터링을 수행하여 총 20개의 고객 그룹을 도출하였다().
이렇게 구성된 키워드 문서들에 대해 ⑧ Topic Analysis를 수행하여 다수의 토픽을 추출한 후, 사용자와 토픽간의 대응 매트릭스를 도출하여 ⑨ User Clustering 단계에서 검색 키워드 기반의 고객 클러스터링을 수행하게 된다. 이후 절에서는 Module 1～Module 3의 세부 과정에 대한 자세한 내용을 소개한다.
제안 방법론은 (1) 인구통계학 정보 기반의 고객 클러스터링(Module 1), (2) 뉴스 접속 기록 기반의 고객 클러스터링(Module 2), 그리고 (3) 포털사이트 검색 키워드 기반의 고객 클러스터링(Module 3)의 세 부분으로 구성되어 있다. 본 연구의 핵심은 고객이 방문한 인터넷 뉴스 기사에 대한 토픽 분석을 통해 고객의 실제 관심을 파악하고 이를 기반으로 고객 클러스터링을 수행하는 것이며, 이는 Module 2에 나타나 있다.
특히 다음소프트의 소셜미디어 분석 솔루션인 ‘소셜 메트릭스’ 서비스는 문맥 중심의 텍스트 마이닝 작업을 통해 각 데이터의 출현 원인 및 다른 데이터들과의 관계를 도식화하여 제공하고 있으며, 와이즈넛의 경우 트위터, 페이스북, 블로그, 카페 등에 올라온 대선 후보 관련 버즈(Buzz)를 분석하기 위한 ‘버즈인사이트바이럴 지수(BVI)’를 개발하였다.

대상 데이터

이 때, 토픽 분석의 품질을 향상시키기 위해 SAS Enterprise Miner 12.1의 Text Parsing 모듈과 서울대학교의 꼬꼬마 형태소 분석기를 활용하여 총 33,147개의 어휘로 구성된 불용어 사전을 구축한 후 분석에 활용하였다.
<그림 3>에 나타난 바와 같이, 본 연구의 실험을 위해 필요한 데이터는 크게 (1) Demography Information, (2) Web Transaction, 그리고 (3) News Articles로 요약될 수 있다. (1) Demography Information과 (2) Web Transaction의 경우, 국내 한 인터넷 사이트 순위 분석 전문 업체로부터 패널(고객) 5,000명의 인구통계학 정보 12개과 해당 패널의 2012년 7월 1일부터 2013년 6월 30일까지 1년 동안의 웹 사용 기록 143,293,592건에 대한 상세항목 18개를 제공 받았으며, 웹 사용기록의 경우 상세항목 중 고객 식별자와 URL만을 분석에 활용하였다. (3) News Articles의 경우, 웹 사용 기록 중 국내 최대 인터넷 뉴스 포털사이트의 접속 기록만을 추출하고, 해당 URL의 기사에 대한 크롤링을 수행하여 기사 394,303건을 분석하였다.
Module 1을 수행하기에 앞서, 인구통계학 정보를 가지고 있는 고객 5,000명 중 인터넷 포털사이트 뉴스 접속 기록과 키워드 검색 기록을 가지고 있는 고객 414명을 분석 대상으로 선정하였다. 선정된 고객 414명은 남성 65%와 여성 35%, 기혼 49%와 미혼 51%로 구성되어 있었으며, 학력 수준은 대졸이 56%로 가장 많고 연령은 30대가 38%로 가장 많은 것으로 파악되었다.
Module 2에서는 국내의 순위 분석 전문 업체로부터 제공 받은 웹 사용 기록 중 국내 최대 인터넷 포털사이트 뉴스 접속 기록만을 추출하고, 해당 URL의 기사에 대한 크롤링을 수행하여 총 394,303건의 뉴스 기사를 수집하였다. 토픽 분석은 Module 1에서 선정된 고객 414명의 인터넷 포털사이트 뉴스 접속 기록만을 추출하여 전체 뉴스 기사 중 3,162건에 대해 수행하였다.
<그림 3>에 나타난 바와 같이, 본 연구의 실험을 위해 필요한 데이터는 크게 (1) Demography Information, (2) Web Transaction, 그리고 (3) News Articles로 요약될 수 있다. (1) Demography Information과 (2) Web Transaction의 경우, 국내 한 인터넷 사이트 순위 분석 전문 업체로부터 패널(고객) 5,000명의 인구통계학 정보 12개과 해당 패널의 2012년 7월 1일부터 2013년 6월 30일까지 1년 동안의 웹 사용 기록 143,293,592건에 대한 상세항목 18개를 제공 받았으며, 웹 사용기록의 경우 상세항목 중 고객 식별자와 URL만을 분석에 활용하였다.
즉, 전체 기사 중 고객 414명이 1년간 접속한 인터넷 포털 사이트 뉴스 기사 3,162건에 대해 토픽 분석을 수행하여 총 50개의 토픽을 추출하였다().
Module 2에서는 국내의 순위 분석 전문 업체로부터 제공 받은 웹 사용 기록 중 국내 최대 인터넷 포털사이트 뉴스 접속 기록만을 추출하고, 해당 URL의 기사에 대한 크롤링을 수행하여 총 394,303건의 뉴스 기사를 수집하였다. 토픽 분석은 Module 1에서 선정된 고객 414명의 인터넷 포털사이트 뉴스 접속 기록만을 추출하여 전체 뉴스 기사 중 3,162건에 대해 수행하였다. 즉, 전체 기사 중 고객 414명이 1년간 접속한 인터넷 포털 사이트 뉴스 기사 3,162건에 대해 토픽 분석을 수행하여 총 50개의 토픽을 추출하였다(<표 6>).

데이터처리

선정된 고객 414명은 남성 65%와 여성 35%, 기혼 49%와 미혼 51%로 구성되어 있었으며, 학력 수준은 대졸이 56%로 가장 많고 연령은 30대가 38%로 가장 많은 것으로 파악되었다. 선정된 고객들의 나이, 접속장소, 성별, 직업, 거주 지역, 결혼 유무, 사용 OS, 소득, 학력, 연령대의 12가지 인구통계학 정보를 활용하여 SAS Enterprise Miner 12.1에서 K-평균 군집화를 통해 전통적 방식의 인구통계학 정보 기반의 클러스터링을 수행하였다. 이 때, 각 클러스터링에 대해 최적 클러스터의 수를 분석 도구에 의해 추천 받는 대신, 반복 실험에 기반한 연구자의 판단을 통해 고객 그룹의 수를 20개씩으로 통일하였다.

성능/효과

Module 1～Module 3의 과정을 통해 (1) 인구통계학 기반의 고객 클러스터링, (2) 뉴스 접속 기록 기반의 고객 클러스터링, (3) 포털사이트 검색 키워드 기반의 고객 클러스터링의 총 3가지 관점의 고객 클러스터링 결과가 도출되었다. 동일한 기준을 사용한 클러스터링의 경우 클러스터 내 동질성 및 클러스터간 이질성을 측정하여 성능 비교가 가능하지만, Module 1～Module 3은 서로 상이한 기준을 사용하여 클러스터링을 수행하였기 때문에 성능 비교가 용이하지 않다.
따라서 본 연구에서는 고객의 평소 인터넷 뉴스 조회 기록에 대한 텍스트 분석을 통해 고객의 실제 관심 분야를 식별하고, 이를 바탕으로 고객을 세분화할 수 있는 방안을 제시하였다. 또한 본 연구에서는 제안 방법론의 실제 적용 가능성을 평가하기 위해 인터넷 사용자 414명 및 이들이 조회한 뉴스 기사 약 3,000건에 대한 텍스트 분석을 수행하고, 그 결과 관심 기반 클러스터링을 통해 인구통계학 정보 기반 클러스터링과는 전혀 다른 고객군을 식별할 수 있음을 확인하였다.
인터넷 뉴스 포털사이트의 경우, 주요 언론사의 기사를 취합하여 재공급하는 특성을 갖기 때문에 특정 매체의 시각에 편향되지 않은 기사를 제공한다는 장점을 갖는다. 또한 충분히 많은 기사 수와 접속 수를 기록하고 있다는 측면에서 본 실험의 대상 데이터로 적합한 특성을 갖고 있다고 할 수 있다.
Module 1을 수행하기에 앞서, 인구통계학 정보를 가지고 있는 고객 5,000명 중 인터넷 포털사이트 뉴스 접속 기록과 키워드 검색 기록을 가지고 있는 고객 414명을 분석 대상으로 선정하였다. 선정된 고객 414명은 남성 65%와 여성 35%, 기혼 49%와 미혼 51%로 구성되어 있었으며, 학력 수준은 대졸이 56%로 가장 많고 연령은 30대가 38%로 가장 많은 것으로 파악되었다. 선정된 고객들의 나이, 접속장소, 성별, 직업, 거주 지역, 결혼 유무, 사용 OS, 소득, 학력, 연령대의 12가지 인구통계학 정보를 활용하여 SAS Enterprise Miner 12.
을 보면 Cluster 4에서는 기혼자가 65%인데 반해, Cluster 5와 Cluster 9에서는 기혼자가 각각 49%, 47%를 차지함으로써, Cluster 4가 조금 다른 특징을 보이고 있으나, 와 를 보면 Cluster 4, Cluster 5, Cluster 9에서 남성이 각각 76%, 61%를 차지하고, 대졸자가 각각 65%, 56%, 57%를 차지함으로써 3개의 클러스터가 비슷한 인구통계 비율을 가지고 있는 것을 알 수 있다.
<그림 13>을 보면 Cluster 4에서는 기혼자가 65%인데 반해, Cluster 5와 Cluster 9에서는 기혼자가 각각 49%, 47%를 차지함으로써, Cluster 4가 조금 다른 특징을 보이고 있으나, <그림 12>와 <그림 14>를 보면 Cluster 4, Cluster 5, Cluster 9에서 남성이 각각 76%, 61%를 차지하고, 대졸자가 각각 65%, 56%, 57%를 차지함으로써 3개의 클러스터가 비슷한 인구통계 비율을 가지고 있는 것을 알 수 있다. 이처럼 뉴스 접속 기록 기반의 고객 클러스터링을 통해 도출된 클러스터들은 각각 서로 다른 관심을 갖는 고객들로 구성되어 있지만, 인구통계 관점에서는 서로 크게 구별되지 않음을 확인하였다.

후속연구

하지만 이는 동일한 기준, 즉 동일한 변수 집합을 통해 수행된 여러 클러스터링 기법의 비교에 적용 가능하며, 본 연구와 같이 유사성을 파악하는 기준 자체를 새롭게 제시하는 방법론의 효과성 검증에는 적용하기 어려운 측면이 있다. 따라서 제안 방법론의 효과성 검증도 클러스터간 이질성 및 클러스터 내 동질성 측면이 아닌 실제 활용성 관점에서 이루어져야 하며, 이는 향후 연구에서 제안 방법론을 적용한 추천시스템의 성능 분석 및 고객의 재구매 예측 정확도 분석 등을 통해 이루어질 수 있다. 또한 향후 연구에서는 데이터 전처리, 분석 대상 기간 선정, 임계값 설정, 토픽 분석, 그리고 고객 클러스터링 등 분석의 모든 세부 과정에 대해 더욱 엄밀한 고찰이 이루어져야 하며, 이를 통해 제안 방법론을 적용한 결과의 품질 및 신뢰도를 더욱 향상시킬 수 있을 것으로 기대한다.
특히 제안 방법론은 인터넷 쇼핑몰의 추천시스템, 재방문 및 재구매 고객 예측 등 유사 관심 고객군의 식별이 필요한 응용 분야에 활용 가능성이 높을 것으로 판단되며, 이는 곧 본 연구의 실무적 기여로 인정받을 수 있다. 또한 학술적 측면에서 본 연구에서는 고객이 조회한 뉴스 기사 및 검색 기록만을 분석하여 고객의 관심을 식별하고 있으나, 향후 더욱 정교한 관심 기반 고객 세분화를 위해 인터넷 게시글, 소셜네트워크 게시글 등에 대해 제안 방법론을 적용한 후속 연구가 진행될 수 있을 것으로 기대한다.
따라서 제안 방법론의 효과성 검증도 클러스터간 이질성 및 클러스터 내 동질성 측면이 아닌 실제 활용성 관점에서 이루어져야 하며, 이는 향후 연구에서 제안 방법론을 적용한 추천시스템의 성능 분석 및 고객의 재구매 예측 정확도 분석 등을 통해 이루어질 수 있다. 또한 향후 연구에서는 데이터 전처리, 분석 대상 기간 선정, 임계값 설정, 토픽 분석, 그리고 고객 클러스터링 등 분석의 모든 세부 과정에 대해 더욱 엄밀한 고찰이 이루어져야 하며, 이를 통해 제안 방법론을 적용한 결과의 품질 및 신뢰도를 더욱 향상시킬 수 있을 것으로 기대한다.

질의응답

핵심어	질문	논문에서 추출한 답변
	고객 세분화를 수행하는 이유는?	하지만 고객 개개인의 니즈(Needs)를 파악하는 것은 많은 어려움이 따를 뿐 아니라 시간과 비용이 지나치게 많이 소비되기 때문에, 이에 대한 대안으로 고객 세분화 즉 고객 클러스터링을 수행하게 된다. 고객 클러스터링의 본질적인 목적은 고객을 동질적인 특성을 가진 집단으로 나누어 보다 손쉽게 고객의 니즈를 파악해 차별화된 마케팅 전략을 수립하는 데에 있다. 기존의 고객 클러스터링은 일반적으로 성별, 연령, 소득 등의 단순하면서도 범용적인 정보, 즉 원시적 형태의 인구통계학 정보를 활용하여 수행되어 왔으며, 최근에는 각 기업들이 보유하고 있는 고객의 구매 내역, 검색 내역 등의 고객 행태 정보를 고객 클러스터링에 활용하고 있다[고은주 외, 2005; 이건창, 정남호, 2003; 진서훈, 2005].
	대부분의 기업들은 수익을 극대화하기 위해 무엇을 하고 있는가?	대부분의 기업들은 고객이 원하는 것을 파악하고 그에 맞는 맞춤형 제품과 서비스를 제공함으로써 수익을 극대화하기 위해 많은 노력을 기울이고 있다. 하지만 고객 개개인의 니즈(Needs)를 파악하는 것은 많은 어려움이 따를 뿐 아니라 시간과 비용이 지나치게 많이 소비되기 때문에, 이에 대한 대안으로 고객 세분화 즉 고객 클러스터링을 수행하게 된다.
	고객 클러스터링을 수행해야 하는 이유는 무엇인가?	대부분의 기업들은 고객이 원하는 것을 파악하고 그에 맞는 맞춤형 제품과 서비스를 제공함으로써 수익을 극대화하기 위해 많은 노력을 기울이고 있다. 하지만 고객 개개인의 니즈(Needs)를 파악하는 것은 많은 어려움이 따를 뿐 아니라 시간과 비용이 지나치게 많이 소비되기 때문에, 이에 대한 대안으로 고객 세분화 즉 고객 클러스터링을 수행하게 된다. 고객 클러스터링의 본질적인 목적은 고객을 동질적인 특성을 가진 집단으로 나누어 보다 손쉽게 고객의 니즈를 파악해 차별화된 마케팅 전략을 수립하는 데에 있다.

참고문헌 (30)

고은주, 권준희, 윤선영, "라이프스타일에 따른 고객 세분화 및 e-CRM 전략제안", Journal of the Korean Society of Clithing and Textiles, 제29권 제6호, 2005, pp. 847-858.
김세훈, "공공임대주택사업의 정책마케팅 적용 방안 연구 -정책고객의 세분화를 통한 마케팅 방향-", 국가정책연구, 제20권 제2호, 2006, pp. 57-91.
류신, 김남규, "거시적 이슈 트래킹의 한계 극복을 위한 개인 관심 트래킹 방법론", 2014 한국IT서비스학회 추계학술대회, 2014, pp.534-543.
문권모, "고객 세분화, 다시 생각해야 한다", LG주간경제, 제767호, 2004.
박광식, "항공사 고객가치 기반의 고객 세분화 사례연구", 관광.레저연구, 제26권 제1호, 2014, pp. 301-318.
박명호, 한장희, 김상우, 백운배, 인터넷 마케팅, 명경사, 2005.
송민영, "고객관계관리를 위한 고객 세분화 방법론 적용 : L사 사례", 한국과학기술원 석사학위논문, 2001.
안요찬, "고객 세분화를 통한 한방병원 고객관계관리 시스템 구축모형", 한국산업정보학회논문지, 제15권 제5호, 2010, pp. 79-87.

원문보기 상세보기
오은녕, 이희상, "클러스터링 기법을 이용한 이동통신의 고객 세분화 연구", 한국경영과학회 2002년 추계학술대회논문집, 2002, pp. 421-424.
윤종수, 윤종욱, "철강유통산업에서의 고객관계관리(CRM)를 위한 고객 세분화 모형", 경영연구, 제19권 제2호, 2004, pp. 144-164.
이건창, 정남호, "기계학습 기반의 웹 마이닝을 이용한 고객 세분화에 관한 연구", 산업공학(IE interfaces), 제16권 제1호, 2003, pp. 54-62.
이두희, 통합적 인터넷 마케팅, 박영사, 2006.
임명수, 김남규, "기간별 이슈 매핑을 통한 이슈 생명주기 분석 방법론", 2014 한국지능정보시스템학회 추계학술대회, 2014, pp. 291-299.
조흥규, "인공지능 방법을 이용한 신용평가 모형에 대한 개관", 나이스채권평가 금융공학연구소, 2003.
정태수, 서의호, 황현석, 임승재, "이동통신회사에서의 Customer Value 측정을 통한 고객 세분화", 한국경영과학회/대한산업공학회 2003 년 춘계공동학술대회논문집, 2003, pp. 281-285.
진서훈, 안상욱, "신용카드업에서 데이터 마이닝의 활용-고객행동기반의 고객 세분화-", 한국통계학회 2004년 학술발표논문집, 2004, pp.171-174.
진서훈, "데이터 마이닝에 의한 고객 세분화 개발", 응용통계연구, 제18권 제3호, 2005, pp.555-565.

원문보기 상세보기
채경희, 김상철, "의사결정나무 기법을 활용한 백화점의 고객 세분화 사례연구", 유통과학연구, 제8권 제1호, 2010, pp. 13-19.
한희섭, 황성훈, 황진수, "풀 서비스 레스토랑 산업에서 고객 세분화 방법을 이용한 고객 지향적 직원 서비스에 관한 연구", 호텔경영학연구, 제22권 제6호, 2013, pp. 297-308.
Albright, R., Taming Text with the SVD, SAS Institute Inc, 2006.
Elmer, P. and Borowski, D., "An expert system approach to financial analysis, The case of S&L bankruptcy", Financial Management, 1988, pp. 66-75.
Han, J. and Kamber, M., Data Mining : Concepts and Techniques, (3rd ed.), Morgan Kaufmann Publishers, 2011.
Hearst, M. A., "Untangling Text Data Mining", in Proceedings of the 37th ACL, 1999.
Mooney, R. J. and Bunescu, R., "Mining Knowledge from Text using Information Extraction", ACM SIGKDD Explorations, Vol. 7, No. 1, 2006, pp. 3-10.
Provost, F. and Fawcett, T., "Data Science for Business", O'Reilly, 2013.
[Salton, G., Wong, A., and Yang, C. S., "A Vector Space Model for Automatic Indexing", Communications of the ACM, Vol. 18, No. 11, 1975, pp. 613-620.

상세보기
Sebastiani, F., "Machine Learning in Automated Text Categorization", ACM Computing Surveys, Vol. 34, No. 1, 2002, pp. 1-47.

상세보기
Sebastiani, F., "Classification of Text, Automatic", The Encyclopedia of Language and Linguistics 14, (2nd ed.), Elsevier Science Pub, 2006, pp. 457-462.
Stanvrianou, A., Andritsos, P., and Nicoloyannis, N., "Overview and Semantic Issues of Text Mining", ACM SIGMOD Record, Vol. 36, No. 3, 2007, pp. 23-34.

상세보기
Witten, I. H., Text Mining, Practical Handbook of Internet Computing, CRC Press, 2004.

저자의 다른 논문 :

LOADING...

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증