온라인 소비자는 쇼핑 웹사이트에서 특정 제품군이나 브랜드에 속한 제품들을 둘러보고 구매를 진행할 수 있고, 혹은 단순히 넓은 범위의 탐색 반경을 보이며 여러 페이지들을 돌아보다 구매를 진행하지 않고 이탈할 수 있다. 이러한 온라인 소비자의 행동과 구매에 관련된 연구는 꾸준히 진행되어왔으며, 실무에서도 소비자들의 행동 데이터를 바탕으로 한 서비스 및 어플리케이션이 개발되고 있다. 최근에는 빅데이터 기술의 발달로 소비자 개인 단위의 맞춤화 전략 및 추천 시스템이 활용되고 있으며 사용자의 쇼핑 경험을 최적화하기 위한 시도가 진행되고 있다. 하지만 이와 같은 시도에도 온라인 소비자가 실제로 웹사이트를 방문해 제품 구매 단계까지 전환될 확률은 매우 낮은 실정이다. 이는 온라인 소비자들이 단지 제품 구매를 위해 웹사이트를 방문하는 것이 아니라 그들의 쇼핑 동기 및 목적에 따라 웹사이트를 다르게 활용하고 탐색하기 때문이다. 따라서 단지 구매가 진행되는 방문 외에도 다양한 방문 형태를 분석하는 것은 온라인 소비자들의 행동을 이해하는데 중요하다고 할 수 있다. 이러한 관점에서 본 연구에서는 온라인 소비자의 탐색 행동의 다양성과 복잡성을 설명하기 위해 실제 E-commerce 기업의 클릭스트림 데이터를 기반으로 세션 단위의 클러스터링 분석을 진행해 탐색 행동을 유형화하였다. 이를 통해 각 유형별로 상세 단위의 탐색 행동과 구매 여부가 차이가 있음을 확인하였다. 또한 소비자 개인이 여러 방문에 걸친 일련의 탐색 유형에 대한 패턴을 분석하기 위해 순차 패턴 마이닝 기법을 활용하였으며, 같은 기간 내에 제품 구매까지 완료한 소비자와 구매를 진행하지 않은 채 방문만 진행한 소비자들의 탐색패턴에 대한 차이를 확인할 수 있었다. 본 연구의 시사점은 대규모의 클릭스트림 데이터를 활용해 온라인 소비자의 탐색 유형을 분석하고 이에 대한 패턴을 분석해 구매 과정 상의 행동을 데이터 기반으로 설명하였다는 점에 있다. 또한 온라인 소매 기업은 다양한 형태의 탐색 유형에 맞는 마케팅 전략 및 추천을 통해 구매 전환 개선을 시도할 수 있으며, 소비자의 탐색 패턴의 변화를 통해 전략의 효과를 평가할 수 있을 것이다.
온라인 소비자는 쇼핑 웹사이트에서 특정 제품군이나 브랜드에 속한 제품들을 둘러보고 구매를 진행할 수 있고, 혹은 단순히 넓은 범위의 탐색 반경을 보이며 여러 페이지들을 돌아보다 구매를 진행하지 않고 이탈할 수 있다. 이러한 온라인 소비자의 행동과 구매에 관련된 연구는 꾸준히 진행되어왔으며, 실무에서도 소비자들의 행동 데이터를 바탕으로 한 서비스 및 어플리케이션이 개발되고 있다. 최근에는 빅데이터 기술의 발달로 소비자 개인 단위의 맞춤화 전략 및 추천 시스템이 활용되고 있으며 사용자의 쇼핑 경험을 최적화하기 위한 시도가 진행되고 있다. 하지만 이와 같은 시도에도 온라인 소비자가 실제로 웹사이트를 방문해 제품 구매 단계까지 전환될 확률은 매우 낮은 실정이다. 이는 온라인 소비자들이 단지 제품 구매를 위해 웹사이트를 방문하는 것이 아니라 그들의 쇼핑 동기 및 목적에 따라 웹사이트를 다르게 활용하고 탐색하기 때문이다. 따라서 단지 구매가 진행되는 방문 외에도 다양한 방문 형태를 분석하는 것은 온라인 소비자들의 행동을 이해하는데 중요하다고 할 수 있다. 이러한 관점에서 본 연구에서는 온라인 소비자의 탐색 행동의 다양성과 복잡성을 설명하기 위해 실제 E-commerce 기업의 클릭스트림 데이터를 기반으로 세션 단위의 클러스터링 분석을 진행해 탐색 행동을 유형화하였다. 이를 통해 각 유형별로 상세 단위의 탐색 행동과 구매 여부가 차이가 있음을 확인하였다. 또한 소비자 개인이 여러 방문에 걸친 일련의 탐색 유형에 대한 패턴을 분석하기 위해 순차 패턴 마이닝 기법을 활용하였으며, 같은 기간 내에 제품 구매까지 완료한 소비자와 구매를 진행하지 않은 채 방문만 진행한 소비자들의 탐색패턴에 대한 차이를 확인할 수 있었다. 본 연구의 시사점은 대규모의 클릭스트림 데이터를 활용해 온라인 소비자의 탐색 유형을 분석하고 이에 대한 패턴을 분석해 구매 과정 상의 행동을 데이터 기반으로 설명하였다는 점에 있다. 또한 온라인 소매 기업은 다양한 형태의 탐색 유형에 맞는 마케팅 전략 및 추천을 통해 구매 전환 개선을 시도할 수 있으며, 소비자의 탐색 패턴의 변화를 통해 전략의 효과를 평가할 수 있을 것이다.
Online consumers browse products belonging to a particular product line or brand for purchase, or simply leave a wide range of navigation without making purchase. The research on the behavior and purchase of online consumers has been steadily progressed, and related services and applications based o...
Online consumers browse products belonging to a particular product line or brand for purchase, or simply leave a wide range of navigation without making purchase. The research on the behavior and purchase of online consumers has been steadily progressed, and related services and applications based on behavior data of consumers have been developed in practice. In recent years, customization strategies and recommendation systems of consumers have been utilized due to the development of big data technology, and attempts are being made to optimize users' shopping experience. However, even in such an attempt, it is very unlikely that online consumers will actually be able to visit the website and switch to the purchase stage. This is because online consumers do not just visit the website to purchase products but use and browse the websites differently according to their shopping motives and purposes. Therefore, it is important to analyze various types of visits as well as visits to purchase, which is important for understanding the behaviors of online consumers. In this study, we explored the clustering analysis of session based on click stream data of e-commerce company in order to explain diversity and complexity of search behavior of online consumers and typified search behavior. For the analysis, we converted data points of more than 8 million pages units into visit units' sessions, resulting in a total of over 500,000 website visit sessions. For each visit session, 12 characteristics such as page view, duration, search diversity, and page type concentration were extracted for clustering analysis. Considering the size of the data set, we performed the analysis using the Mini-Batch K-means algorithm, which has advantages in terms of learning speed and efficiency while maintaining the clustering performance similar to that of the clustering algorithm K-means. The most optimized number of clusters was derived from four, and the differences in session unit characteristics and purchasing rates were identified for each cluster. The online consumer visits the website several times and learns about the product and decides the purchase. In order to analyze the purchasing process over several visits of the online consumer, we constructed the visiting sequence data of the consumer based on the navigation patterns in the web site derived clustering analysis. The visit sequence data includes a series of visiting sequences until one purchase is made, and the items constituting one sequence become cluster labels derived from the foregoing. We have separately established a sequence data for consumers who have made purchases and data on visits for consumers who have only explored products without making purchases during the same period of time. And then sequential pattern mining was applied to extract frequent patterns from each sequence data. The minimum support is set to 10%, and frequent patterns consist of a sequence of cluster labels. While there are common derived patterns in both sequence data, there are also frequent patterns derived only from one side of sequence data. We found that the consumers who made purchases through the comparative analysis of the extracted frequent patterns showed the visiting pattern to decide to purchase the product repeatedly while searching for the specific product. The implication of this study is that we analyze the search type of online consumers by using large - scale click stream data and analyze the patterns of them to explain the behavior of purchasing process with data-driven point. Most studies that typology of online consumers have focused on the characteristics of the type and what factors are key in distinguishing that type. In this study, we carried out an analysis to type the behavior of online consumers, and further analyzed what order the types could be organized into one another and become a series of search patterns. In addition, online retailers will be able to try to improve their purcha
Online consumers browse products belonging to a particular product line or brand for purchase, or simply leave a wide range of navigation without making purchase. The research on the behavior and purchase of online consumers has been steadily progressed, and related services and applications based on behavior data of consumers have been developed in practice. In recent years, customization strategies and recommendation systems of consumers have been utilized due to the development of big data technology, and attempts are being made to optimize users' shopping experience. However, even in such an attempt, it is very unlikely that online consumers will actually be able to visit the website and switch to the purchase stage. This is because online consumers do not just visit the website to purchase products but use and browse the websites differently according to their shopping motives and purposes. Therefore, it is important to analyze various types of visits as well as visits to purchase, which is important for understanding the behaviors of online consumers. In this study, we explored the clustering analysis of session based on click stream data of e-commerce company in order to explain diversity and complexity of search behavior of online consumers and typified search behavior. For the analysis, we converted data points of more than 8 million pages units into visit units' sessions, resulting in a total of over 500,000 website visit sessions. For each visit session, 12 characteristics such as page view, duration, search diversity, and page type concentration were extracted for clustering analysis. Considering the size of the data set, we performed the analysis using the Mini-Batch K-means algorithm, which has advantages in terms of learning speed and efficiency while maintaining the clustering performance similar to that of the clustering algorithm K-means. The most optimized number of clusters was derived from four, and the differences in session unit characteristics and purchasing rates were identified for each cluster. The online consumer visits the website several times and learns about the product and decides the purchase. In order to analyze the purchasing process over several visits of the online consumer, we constructed the visiting sequence data of the consumer based on the navigation patterns in the web site derived clustering analysis. The visit sequence data includes a series of visiting sequences until one purchase is made, and the items constituting one sequence become cluster labels derived from the foregoing. We have separately established a sequence data for consumers who have made purchases and data on visits for consumers who have only explored products without making purchases during the same period of time. And then sequential pattern mining was applied to extract frequent patterns from each sequence data. The minimum support is set to 10%, and frequent patterns consist of a sequence of cluster labels. While there are common derived patterns in both sequence data, there are also frequent patterns derived only from one side of sequence data. We found that the consumers who made purchases through the comparative analysis of the extracted frequent patterns showed the visiting pattern to decide to purchase the product repeatedly while searching for the specific product. The implication of this study is that we analyze the search type of online consumers by using large - scale click stream data and analyze the patterns of them to explain the behavior of purchasing process with data-driven point. Most studies that typology of online consumers have focused on the characteristics of the type and what factors are key in distinguishing that type. In this study, we carried out an analysis to type the behavior of online consumers, and further analyzed what order the types could be organized into one another and become a series of search patterns. In addition, online retailers will be able to try to improve their purcha
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
결론적으로, 온라인 쇼핑을 진행하는 소비자들은 개인의 구매 의사결정의 단계, 제품의 특성에 따른 불확실성, 쇼핑을 진행하게 만드는 목적 및 동기에 따라 웹 사이트 내에서의 탐색 행동이 다르게 나타나며, 이는 다시 여러가지의 유형들로 설명될 수 있다. 본 연구에서는 소비자들의 다양한 쇼핑 상황 및 구매 결정 단계를 고려할 수 있는 대규모의 클릭스트림 데이터를 분석함으로써 기존 연구에서 밝혀진 탐색 유형들과의 차이를 분석하였다.
본 연구에서는 실제 온라인 쇼핑 유저들의 대규모 클릭스트림 데이터를 기반으로 그들의 다양한 탐색 행동을 유형화하고 해당 유형들의 순차적 패턴을 도출함으로써 복잡하고 다양한 온라인 소비자의 행동을 이해하기 위한 분석을 진행하였다.
이는 곧 구매를 하기 전까지 대안을 설정하기 위한 정보 수집, 대안의 평가 등의 행동이 여러 번의 방문을 통해 진행될 수 있다는 점을 의미한다. 클러스터링 분석을 통해 도출된 유형은 소비자의 방문 목적과 행동을 설명할 수 있기 때문에 이를 활용하여, 구매를 결정한 소비자 집단의 방문 패턴과 단순히 탐색만 진행하고 이탈한 소비자 집단의 방문 패턴 간의 차이를 분석하여 구매의사결정 과정 상에 다른 단계에 있는 소비자들의 이질적인 행동을 파악하고자 한다. 이를 위해 각 유형들의 비율만을 분석하기 보다는 여러 방문 유형의 순서 조합을 도출할 수 있는 순차 패턴 마이닝 기법을 활용한다.
제안 방법
먼저 클러스터 1의 가장 두드러진 특징은 세션 내에서 프로모션 관련 페이지에 가장 많이 집중을 한다는 점이다. Moe, 2003의 연구에서 활용한 페이지 분류와 다르게 본 연구에서는 추가로 프로모션 페이지 유형을 추가해 클러스터링 분석을 진행하였다. 전체 방문 세션 중에 12%가 이 유형에 속하며, 프로모션 페이지에서 가장 많이 머무름과 동시에 4가지 도출된 유형중 페이지 뷰가 평균적으로 가장 적은 점이 특징이다.
여러 형태의 웹 페이지 단위의 탐색 행동 특징들을 클러스터링 분석을 통해 유형화할 수 있었으며, 기존의 관련 연구와 유사하면서도 차이점이 존재하는 탐색 유형들이 도출되었다. 그리고 대부분의 온라인 쇼핑 탐색 혹은 방문 유형에 대한 연구들은 해당 유형의 도출 및 분석만을 진행한 반면, 본 연구에서는 해당 유형들이 어떤 순서와 패턴을 가지는지를 패턴 마이닝 기법을 통해 도출하였다. 특히 같은 기간 내에 제품 구매를 완료한 소비자와 구매를 하지 않으면서 제품을 둘러보기만 하는 소비자들의 탐색 패턴 간의 차이점을 도출할 수 있었다.
클러스터링 분석에 활용되는 세션 단위의 변수들 중 비율을 제외한 실수 및 정수에 해당하는 변수는 표준화 처리하여 학습을 진행하였다. 또한 Mini-batch K-means는 배치 사이즈를 결정해야 하는데 이는 반복적으로 클러스터링을 진행하면서 학습 시간 및 클러스터링 결과를 고려해 50개로 결정하였다.
본 연구의 학술적 시사점은 다음과 같다. 먼저 탐색 유형을 도출하는 과정은 기반 연구가 되는 Moe, 2003의 연구와 유사했지만, 본 연구에서는 제품을 구매하기까지 과정에 더 연관성이 있는 페이지 유형 분류를 통해 분석을 진행하여 다른 탐색 유형을 도출하였다. 또한 클릭스트림 데이터를 활용한 유형화 연구(Moe, 2003; Phang et al.
온라인 쇼핑 유저의 탐색 유형들의 순서를 담고 있는 시퀀스 데이터에 순차 패턴 마이닝을 적용해 클러스터링을 통해 도출한 4가지의 유형들의 순서 조합 중 빈발 패턴을 도출하였다. 본 분석의 활용 데이터의 기간인 한 달 동안 제품 구매를 진행한 유저 집단과 구매를 진행하지 않고 제품 탐색만 진행한 유저 집단의 패턴을 따로 도출하여 이들의 차이를 분석하였다. 빈발 패턴을 도출하는 최소 지지도는 10%로 설정하였으며, 2개 이상의 탐색 유형 시퀀스에 대해서는 유형간 순서가 나타날 비율을 설명할 수 있는 신뢰도를 계산하였다.
, 2010). 본 연구에서도 이와 같은 분석 과정을 진행하였으며 더 나아가 유형들이 서로 어떤 순서로 구성되어 일련의 탐색 패턴이 될 수 있는지를 분석하였다. 특히 제품 구매를 완료한 유저들의 탐색 과정 패턴에서는 넓은 범위의 탐색을 진행한 후 특정 제품으로 선택사항을 좁혀 나가는 행동을 보이는 반면 구매를 진행하지 않은 유저들의 탐색 과정 에서는 탐색 범위가 좁혀지는 형태가 빈발 패턴이 도출되지 않았다.
클릭스트림 데이터 연구들 중 E-commerce 웹 사이트 방문자들의 온라인 구매 행동을 이해하고 모델링에 대한 연구 주제가 가장 활발하게 진행되는 분야에 속한다(Bucklin and Sismeiro, 2009). 본 연구에서도 클릭스트림 데이터 연구들의 내용을 기반으로 온라인 소비자의 쇼핑 행동과 관련된 주요 요인들을 고려해 탐색 행동 및 쇼핑 패턴에 대한 분석을 진행하였다.
, 2013 의 연구에서는 온라인 상에서의 패턴을 예측하는 과정에서 세션을 정의할 때, 가장 많이 쓰이는 임계값인 30분보다 10분으로 설정할 때가 더 사용자 세션을 잘 구분할 수 있음을 확인하였다. 본 연구에서도 페이지 요청 시간의 차이를 기준으로 세션을 정의하였으며, 세션을 구분하는 시간 차이 기준 값은 10분으로 설정하였다.
Moe, 2003의 연구에서는 여러 페이지의 클릭을 담고 있는 세션 단위로 어떤 유형의 페이지를 탐색했는지에 대한 비율을 변수로 활용해 웹 사이트 방문 형태를 유형화 하였다. 본 연구의 분석 과정에서는 이전의 관련 연구에서 활용된 요인들을 포함해 온라인 소비자의 웹 사이트 내에서의 행동을 설명할 수 있는 변수들을 활용해 세션 단위의 클러스터링을 진행한다. 이를 통해 웹사이트를 방문하는 하는 여러 목적과 소비자의 행동을 유형화해 설명한다.
온라인 소비자의 방문과 방문 내에서의 이질적인 탐색 행동들을 분류하기 위해 클러스터링 분석을 진행한다. K-means 알고리즘은 학습의 효율과 성능이 비교적 우수해 다양한 클러스터링 문제에 적용되어왔으며, 온라인 쇼핑 방문 유형을 분석한 연구에서도 가장 많이 활용되었다(Moe, 2003; Phang et al.
온라인 쇼핑 유저의 탐색 유형들의 순서를 담고 있는 시퀀스 데이터에 순차 패턴 마이닝을 적용해 클러스터링을 통해 도출한 4가지의 유형들의 순서 조합 중 빈발 패턴을 도출하였다. 본 분석의 활용 데이터의 기간인 한 달 동안 제품 구매를 진행한 유저 집단과 구매를 진행하지 않고 제품 탐색만 진행한 유저 집단의 패턴을 따로 도출하여 이들의 차이를 분석하였다.
Moe (2003)의 연구에서는 웹 페이지들을 특정 기준으로 분류하고(제품 상세, 카테고리, 브랜드, 구매 등), 사용자의 온라인 행동을 설명하기 위해 페이지 뷰와 머무른 시간 등의 변수를 통해 클러스터링 분석을 진행하였다. 이를 통해 온라인 소비자들 개개인의 쇼핑 계획 및 전략의 유형 4가지(Directed buying, Search/deliberation, Hedonic browsers, Knowledge-building)를 발견하였고 각각의 유형들의 탐색 패턴이 다름을 확인하였다. Montgomery et al.
또한 온라인 쇼핑 소비자는 개인의 쇼핑 경험과 목적, 동기에 따라 제품 구매를 확정하기까지 다양한 탐색 행동들에 대한 일련의 패턴 혹은 규칙을 가질 수 있다. 이에 대한 분석을 위해 클러스터링 분석을 통해 여러 탐색 유형을 도출한 후, 순차 패턴 마이닝 기법을 적용하여 온라인 소비자들의 탐색 형태에 대한 패턴을 분석하는 과정을 진행한다.
, 2010). 클러스터링 분석에 활용되는 세션 단위의 변수들 중 비율을 제외한 실수 및 정수에 해당하는 변수는 표준화 처리하여 학습을 진행하였다. 또한 Mini-batch K-means는 배치 사이즈를 결정해야 하는데 이는 반복적으로 클러스터링을 진행하면서 학습 시간 및 클러스터링 결과를 고려해 50개로 결정하였다.
2010). 클러스터의 수를 결정하는 과정은 초기의 2개 클러스터로부터 기존 클러스터와 동일한 클러스터가 나오거나 추가된 클러스터가 의미 있는 샘플 수를 충족하지 못할 때가지 클러스터의 수를 증가시켜 분석을 진행하였다(Moe. 2003; Phang et al., 2010). 클러스터링 분석에 활용되는 세션 단위의 변수들 중 비율을 제외한 실수 및 정수에 해당하는 변수는 표준화 처리하여 학습을 진행하였다.
본 연구에서는 온라인 쇼핑을 진행하는 소비자의 다양한 탐색 행동과 구매 행동을 이해하기 위한 마이닝 기법을 활용한다. 탐색을 한 페이지의 수, 머무른 시간, 페이지의 유형, 구매 여부 등의 정보를 포함하는 대규모의 세션 단위 데이터를 대상으로 다소 복잡하고 이질적인 행동의 특성을 이해하기 위해 웹 사이트 내에서의 행동 패턴을 유형화할 수 있는 클러스터링 분석을 진행한다. 또한 온라인 쇼핑 소비자는 개인의 쇼핑 경험과 목적, 동기에 따라 제품 구매를 확정하기까지 다양한 탐색 행동들에 대한 일련의 패턴 혹은 규칙을 가질 수 있다.
대상 데이터
본 연구의 분석에서는 국내 패션 산업을 주도하고 있는 기업의 공식 쇼핑 웹사이트를 방문한 유저들의 클릭스트림 데이터와 유저들의 구매 기록 데이터를 활용한다. 2018년 10월 1달 동안 해당 웹사이트에 접속한 유저들의 페이지 단위 클릭 데이터를 수집하였으며 페이지에 머문 시간이 1초 이하인 비이상적 클릭 형태를 제외한 총 8,417,303개의 데이터 포인트가 포함된 데이터셋을 최종적으로 활용하였다. 해당 웹사이트로 유입된 유저는 총 500여개가 넘는 개별 브랜드와 15개 이상의 통합 제품 카테고리를 선택할 수 있다.
세션 단위의 변수들의 통계량들은 [Table 4]의 내용과 같다. 변수 도출 후, 페이지 뷰가 1개 이거나 페이지에 머무른 평균 시간이 이상치에 해당하는 세션을 제외하고 총 549,872개의 유저 세션을 도출하여 분석을 진행하였다.
본 연구의 분석에서는 국내 패션 산업을 주도하고 있는 기업의 공식 쇼핑 웹사이트를 방문한 유저들의 클릭스트림 데이터와 유저들의 구매 기록 데이터를 활용한다. 2018년 10월 1달 동안 해당 웹사이트에 접속한 유저들의 페이지 단위 클릭 데이터를 수집하였으며 페이지에 머문 시간이 1초 이하인 비이상적 클릭 형태를 제외한 총 8,417,303개의 데이터 포인트가 포함된 데이터셋을 최종적으로 활용하였다.
데이터처리
공통 도출 패턴에 대해서는 두 집단에서 각각 1000개의 세션을 무작위로 추출하여 공통 빈발 패턴의 지지도와 신뢰도 값의 샘플 100개를 구성하였으며, 해당 패턴의 지지도(support)와 신뢰도(confidence)의 평균에 대한 차이를 T-test를 통해 유의한 차이가 있음을 확인하였다. 두 집단에서 도출된 패턴의 주요한 차이는 구매 확률이 가장 높은 클러스터4의 지지도이다.
빈발 패턴을 도출하는 최소 지지도는 10%로 설정하였으며, 2개 이상의 탐색 유형 시퀀스에 대해서는 유형간 순서가 나타날 비율을 설명할 수 있는 신뢰도를 계산하였다.
이론/모형
[Figure 3]에 표현한 것처럼, 세션 단위의 클러스터링 레이블을 활용하여 유저 단위의 방문 순서를 표현한 시퀀스 데이터를 구축하였다. 그리고 다양한 순차 패턴 마이닝 알고리즘 중에서도 후보 패턴을 데이터베이스 내에서 찾는 다른 알고리즘과 다르게 시퀀스 데이터베이스 내에서 깊이 우선 검색(Depth First Search)을 활용하는 PrefixSpan 알고리즘을 활용하였다(Pei et al., 2004).
본 연구에서는 온라인 쇼핑을 진행하는 소비자의 다양한 탐색 행동과 구매 행동을 이해하기 위한 마이닝 기법을 활용한다. 탐색을 한 페이지의 수, 머무른 시간, 페이지의 유형, 구매 여부 등의 정보를 포함하는 대규모의 세션 단위 데이터를 대상으로 다소 복잡하고 이질적인 행동의 특성을 이해하기 위해 웹 사이트 내에서의 행동 패턴을 유형화할 수 있는 클러스터링 분석을 진행한다.
클러스터링 분석을 통해 도출된 유형은 소비자의 방문 목적과 행동을 설명할 수 있기 때문에 이를 활용하여, 구매를 결정한 소비자 집단의 방문 패턴과 단순히 탐색만 진행하고 이탈한 소비자 집단의 방문 패턴 간의 차이를 분석하여 구매의사결정 과정 상에 다른 단계에 있는 소비자들의 이질적인 행동을 파악하고자 한다. 이를 위해 각 유형들의 비율만을 분석하기 보다는 여러 방문 유형의 순서 조합을 도출할 수 있는 순차 패턴 마이닝 기법을 활용한다. [Figure 2]는 전체 분석 단계의 요약 과정을 담고 있으며, 각 단계 별로 포함된 상세 내용을 다음 절에서 기술하였다.
분석에 활용될 데이터 역시 대규모의 클릭스트림 데이터로부터 추출된 사용자들의 방문 단위 데이터이기 때문에 K-means 알고리즘으로 학습을 진행할 경우 시간 및 연산 효율이 매우 저하될 수 있다. 이를 위해 기존의 K-means 알고리즘을 개선한 Mini-Batch K-means 알고리즘을 분석에 활용하였다. Mini-Batch K-means는 임의로 데이터 샘플들을 고정된 크기의 배치에 지정하고 배치 단위의 반복 학습을 통해 샘플들의 클러스터를 지정하는 과정을 거친다.
성능/효과
[Table 2]을 통해 알 수 있듯이, 기존의 관련 연구에서 도출된 여러 방문 유형들에 따라 각각 어떤 유형의 웹페이지를 집중해서 방문하는지 다양한 제품 유형들을 탐색하는지 등의 웹상에서의 구체적 행동들이 다름을 알 수 있다. 결론적으로, 온라인 쇼핑을 진행하는 소비자들은 개인의 구매 의사결정의 단계, 제품의 특성에 따른 불확실성, 쇼핑을 진행하게 만드는 목적 및 동기에 따라 웹 사이트 내에서의 탐색 행동이 다르게 나타나며, 이는 다시 여러가지의 유형들로 설명될 수 있다. 본 연구에서는 소비자들의 다양한 쇼핑 상황 및 구매 결정 단계를 고려할 수 있는 대규모의 클릭스트림 데이터를 분석함으로써 기존 연구에서 밝혀진 탐색 유형들과의 차이를 분석하였다.
마지막으로 클러스터 4는 구매율이 가장 높으면서 반복적으로 동일 제품을 탐색하는 점이 가장 큰 특징이다. 또한 검색 기능을 가장 많이 활용하는 유형이면서, 브랜드, 제품 카테고리, 제품에 대한 다양도가 모두 낮게 나타났다. 페이지에 머무른 평균 시간은 다른 유형들에 비해 가장 짧으면서 세션 내에 페이지 뷰는 가장 많은 것으로 나타났다.
, 2018). 본 연구의 분석 결과에서 도출한 각 탐색 유형들의 순차적인 패턴은 온라인 소비자의 구매 의사결정 과정이 기존의 연구에서 제안한 단계의 반복과 순환을 가질 수 있음을 데이터 기반으로 설명할 수 있음을 보였다는 점에서 학문적 시사점을 가질 수 있다.
클러스터 3은 클러스터 2 와는 다르게 여러가지의 브랜드에 걸쳐 특정 제품 카테고리에 제한된 제품 탐색을 하는 것이 주된 특징이라고 할 수 있다. 세션 내에서 제품 상세 페이지의 비중이 70% 정도로 나타나며, 특정 제품 카테고리에 속하는 다양한 제품들을 탐색해 제품에 대한 다양도가 가장 높은 것으로 나타났다. 그렇기 때문에 자연스럽게 특정 제품을 반복해서 탐색하는 횟수 역시 가장 낮은 것으로 나타났다.
두 번째 시사점은 복잡하고 다양한 형태의 온라인 소비자의 쇼핑 패턴을 설명하기 위해 클러스터링과 순차 패턴 마이닝 두 가지의 방법들을 제안했다는 점에 있다. 여러 형태의 웹 페이지 단위의 탐색 행동 특징들을 클러스터링 분석을 통해 유형화할 수 있었으며, 기존의 관련 연구와 유사하면서도 차이점이 존재하는 탐색 유형들이 도출되었다. 그리고 대부분의 온라인 쇼핑 탐색 혹은 방문 유형에 대한 연구들은 해당 유형의 도출 및 분석만을 진행한 반면, 본 연구에서는 해당 유형들이 어떤 순서와 패턴을 가지는지를 패턴 마이닝 기법을 통해 도출하였다.
두 집단에서 도출된 패턴의 주요한 차이는 구매 확률이 가장 높은 클러스터4의 지지도이다. 클러스터4와 관련된 패턴과 다음 방문에 클러스터4 유형으로 이어지는 패턴의 지지도와 신뢰도 모두 구매를 확정한 집단에서 더 높게 도출되었다. 반대로 매우 다양하고 넓은 범위의 제품 카테고리와 브랜드를 탐색하는 클러스터2와 연속해서 클러스터2의 형태로 쇼핑을 진행하는 패턴은 구매를 진행하지 않은 집단에서 더 높게 도출되었다.
클러스터링 분석을 통해 방문 유형은 총 4가지 유형들로 도출되었으며 결과의 요약은 [Table 6]를 통해 확인할 수 있다.
반대로 매우 다양하고 넓은 범위의 제품 카테고리와 브랜드를 탐색하는 클러스터2와 연속해서 클러스터2의 형태로 쇼핑을 진행하는 패턴은 구매를 진행하지 않은 집단에서 더 높게 도출되었다. 특정 제품 카테고리가 정해진 상태에서 여러 브랜드에 걸쳐 다양한 제품을 비교하는 형태인 클러스터3의 비율은 두 집단에서 비슷하지만 연속해서 같은 유형의 방문을 진행하거나 클러스터4의 형태로 쇼핑을 하는 비율은 구매 집단에서 더 높게 도출되었다. 특히 클러스터3에서 클러스터4로 이어지는 경우는 제품 탐색의 옵션이 더 좁혀지는 방문 형태라고 볼 수 있으며, 두 집단 간 해당 패턴의 신뢰도의 차이가 크기 때문에 구매를 결정하고자 하는 소비자일수록 이와 같은 쇼핑 행태를 보일 확률이 높다 할 수 있다.
또한 검색 기능을 가장 많이 활용하는 유형이면서, 브랜드, 제품 카테고리, 제품에 대한 다양도가 모두 낮게 나타났다. 페이지에 머무른 평균 시간은 다른 유형들에 비해 가장 짧으면서 세션 내에 페이지 뷰는 가장 많은 것으로 나타났다. 일반적으로 온라인 쇼핑 환경에서 경험재에 속한 제품을 탐색할 때는 해당 제품의 속성에 대한 정보를 처리하는 시간은 탐색재에 비해 오래 걸리기 때문에 페이지에 머무르는 시간 또한 길어지게 된다(Huang et al.
후속연구
이 때 온라인 마케터는 제품 추천 시스템과 프로모션 전략을 활용해 특정 제품 페이지로의 유입과 제품의 구매 전환율을 개선할 수 있을 것이다. 또한 구매까지의 방문 유형의 과정이 비슷한 집단을 추출해 대조군과 실험군을 나누어 개별 마케팅 전략들의 효과가 유저들의 방문 패턴에 변화를 줄 수 있는지, 구매 결정을 빠르게 만들 수 있는지를 확인하기 위해 본 연구에서 제시한 방법들을 활용해 평가할 수 있을 것이다.
따라서 디바이스에 따라 어떤 탐색 유형이 빈번하게 나타나며, 같은 사용자여도 각 디바이스를 어느 목적에 따라 사용하는지를 패턴 분석을 통해 탐색해볼 수 있을 것이다. 마지막으로 유저의 인구통계학적 특성과 FM(Recency, Frequency, Monetary)과 같은 다양한 기준으로 유저 세분화 그룹 별로 탐색 유형과 그 패턴에 대한 분석을 진행한다면, 더 넓은 관점에서 온라인 소비자의 제품 탐색 및 구매 행동에 대한 이해가 가능할 것이다.
본 연구에서 활용한 데이터는 여러 브랜드의 선택 상황도 반영할 수 있지만, 같은 제품 카테고리에 대해 다른 기업 내의 브랜드에 속하는 제품 탐색은 분석에 반영할 수 없었다. 만약 유저 중심의 클릭스트림 데이터를 활용할 수 있다면, 탐색 유형에 대한 타당성을 더 확보하는 동시에, 탐색 패턴에 대한 더 깊이 있는 분석이 가능할 것이다. 두 번째 한계점으로는 유저의 접속 디바이스에 대한 영향을 고려하지 않았다는 점을 들 수 있다.
첫 번째로, 분석에 활용된 데이터는 하나의 온라인 유통기업의 웹사이트 내 클릭스트림 데이터로 이는 패널 형태의 유저 중심 클릭스트림 데이터에 비해 유저의 모든 탐색 행동을 담지 못한다는 한계를 가진다(Bucklin and Sismeiro, 2009). 본 연구에서 활용한 데이터는 여러 브랜드의 선택 상황도 반영할 수 있지만, 같은 제품 카테고리에 대해 다른 기업 내의 브랜드에 속하는 제품 탐색은 분석에 반영할 수 없었다. 만약 유저 중심의 클릭스트림 데이터를 활용할 수 있다면, 탐색 유형에 대한 타당성을 더 확보하는 동시에, 탐색 패턴에 대한 더 깊이 있는 분석이 가능할 것이다.
다시 말해, 시간 순서 상의 사건 혹은 품목들이 하나의 시퀀스 단위에 속하게 되고, 이러한 시퀀스가 데이터베이스 형태로 구축이 되어 있을 때, 순차 패턴 마이닝을 적용하면 최소 지지도 즉, 전체 시퀀스 중에서 일정 빈도수 이상을 가지는 순서를 도출해낼 수 있다. 본 연구의 분석 과정에서도 클러스터링 분석을 통해 도출된 여러 형태의 온라인 쇼핑 유형들에 대한 빈발 패턴을 도출하고 구매까지 완료한 유저와 구매를 하지 않은 유저의 빈발 패턴 간의 차이를 분석할 것이다. [Figure 3]에 표현한 것처럼, 세션 단위의 클러스터링 레이블을 활용하여 유저 단위의 방문 순서를 표현한 시퀀스 데이터를 구축하였다.
본 연구의 실무적 시사점은 다음과 같다. 온라인 마케터는 본 연구의 분석 과정 및 결과를 활용해 구매 전환율을 제고하기 위한 마케팅 전략을 실행할 수 있을 것이다. 특히 제품 구매를 완료하기까지의 탐색 패턴은 넓은 범위의 탐색에서 특정 제품의 반복 탐색으로 범위를 좁히는 형태를 보였다.
1994), 여러 형태의 탐색 과정을 통해 특정 제품에 대한 평가로 이어지는 과정을 효율적으로 만드는 것이 제품 구매율을 높일 수 있다는 점을 본 연구의 분석 결과를 통해 알 수 있다. 즉, 특정 소수의 제품들을 반복적으로 탐색하기 위한 방문 유형이 연속된다면 제품 구매 결정 단계에 가까워지고 있음을 유추할 수 있을 것이다. 이 때 온라인 마케터는 제품 추천 시스템과 프로모션 전략을 활용해 특정 제품 페이지로의 유입과 제품의 구매 전환율을 개선할 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
소비자들이 이전에 탐색한 제품들을 온라인 쇼핑 카트에 넣어 구매 진행의 편의를 높이는데, 그럼에도 불구하고 실제 카트에 담긴 채 구매까지 진행되지 않는 비율이 70%가 넘는다고 한다. 이는 무엇을 의미하는가?
또한 소비자는 이전에 탐색한 제품들을 온라인 쇼핑 카트에 넣어 구매 진행의 편의를 높일 수 있지만(Kukar-Kinney and Close, 2010), 실제로 카트에 담긴 채 구매까지 진행되지 않는 비율은 70%가 넘는다(Statista, 2018). 이는 곧, 데이터와 IT의 활용을 통해 웹사이트로 소비자들을 유입시키는 여러 노력에도 불구하고 실제로 구매로 이어지는 확률은 상대적으로 매우 낮다는 것을 의미한다. 실제로 온라인 소비자들은 제품 구매를 목적으로 하는 것이 아닌 여러 동기와 목적에 따라 다양한 형태로 웹사이트를 탐색할 수 있으며, 이러한 여러 형태의 행동을 이해하기 위한 선행 연구들이 진행되어 왔다(Moe, 2003, 2006; Montgomery et al.
많은 기업들이 소비자의 구매를 유도하기 위하여 관련 데이터를 활용한 어플리케이션 및 서비스를 응용하고 있는데, 이에 대하여 대표적인 것은 무엇이 있는가?
이와 같은 데이터는 소비자의 쇼핑 경험을 설명하기 때문에 많은 기업들은 소비자의 구매를 유도하기 위해 관련 데이터를 활용한 어플리케이션 및 서비스를 응용하고 있으며 활발하게 연구가 진행되고 있다. 대표적으로 웹 사이트의 콘텐츠 개인화(Eirinaki and Vazirgiannis, 2003; Hong and Tam, 2006), 추천 시스템(Huang et al., 2006; Lu et al., 2015; Lee, 2018), 광고 최적화(Goh et al., 2015; Bae and Park., 2018) 등이 활용되고 있다.
정보 처리이론의 관점에서 소비자의 의사 결정 과정은 어떻게 구분되는가?
특히 정보 처리 이론은 소비자의 행동 모델 소비자 행동에 관련된 모델을 구성하는데 가장 중요한 요인을 포함하고 있다. [Figure 1]에서 알 수 있듯이, 소비자의 의사 결정 과정은 정보 처리이론의 관점에서 문제/니즈의 인지, 정보 탐색, 대안 평가 및 선택, 구매, 구매 후 행동의 다섯 단계로 구분이 가능하다. 물리적 매장에서의 쇼핑을 하는 소비자의 행동을 설명하지만, 온라인 소비자의 행동을 설명하기 위한 연구에서도 기존의 소비자 구매 의사결정 과정이 적용되었다(Kukar-Kinney and Close, 2010; Jansen and Schuster, 2011; Karimi et al.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.