[논문]온라인 상품 카테고리 내 주요 가격대 식별

김준우; 임광혁

doi:10.5392/jkca.2012.12.12.733

온라인 상품 카테고리 내 주요 가격대 식별
Identifying the Main Price Ranges of Online Product Category 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.12 no.12, 2012년, pp.733 - 741

김준우 (동아대학교 산업경영공학과) , 임광혁 (배재대학교 전자상거래학과)

초록
AI-Helper

최근 많은 소비자들이 관심 있는 물품 카테고리에 대한 정보를 얻기 위한 목적으로 종합 쇼핑몰이나 가격 비교 사이트를 방문하고 있다. 하지만, 이러한 웹 사이트들은 종종 이들에게 많은 상품들과 판매자가 포함된 지나치게 방대한 정보를 제공하여 소비자들의 구매 결정을 효과적으로 지원하지 못한다. 따라서 현대 온라인 쇼핑 에이전트들은 검색된 정보를 사용자들에게 제공하기 전에 보다 지능적인 방법으로 이를 가공할 필요가 있다. 본 논문은 특정 물품 카테고리 내에서 많은 상품들이 분포하고 있는 주요 가격대를 식별하는 방법을 제안하고자 한다. 이를 위해 한 개 카테고리 내 상품의 가격들을 벡터로 표현하고, 여기에 k-means 군집 분석을 적용하여 서로 비슷한 가격 벡터들을 포함하는 군집을 형성한 다음, 각 군집에서 주요 가격대를 추출하는 방법을 적용하였다. 일반적으로 가격은 소비자들의 구매 결정에서 가장 중요한 요인 중 하나이기 때문에, 추출된 주요 가격대들은 온라인 쇼핑 이용자들이 효과적으로 상품을 검색하는데 도움이 될 것으로 기대된다.

Abstract ▼ AI-Helper

In recent, many consumers visit the online shopping malls or price comparison sites to collect the information on the product category that they are interested in. However, the volumes of the data provided by such web sites are often too enormous, and significant number of consumers have trouble in making purchase decision based on the plethora of products and sellers. In this context, modern online shopping agents need to process the retrieved information in more intelligent way before providing them to the users. This paper proposes a novel approach for identifying the main price ranges hidden in a single product category. To this end, the price of an item in the category is represented as a row vector and k-means clustering analysis is applied to the price vectors to produce the clusters that consists of the product items with similar price vectors. Then, the main price ranges of the product category can be identified from the result of clustering analysis. In general, the price is one of the most important factors in the consumers' purchase decision, and the identified main price ranges will be helpful for the online shoppers to find appropriate items effectively.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

반면, 실제 한 개 물품 카테고리 내에는 가격의 분포가 지극히 넓은 상품들이 상당수 존재하는데, 이러한 경우들은 외형상으로는 동일한 상품이나 사양이나 구매 조건 또는 제공 혜택의 차이 등으로 인해 서로 다른 상품으로 취급하는 것이 더 바람직한 경우라고 생각된다. 따라서, 본 논문에서는 가격 분포가 넓은 상품들은 제외하고, 어느 정도 밀집된 가격 분포를 갖는 상품들에 대해서만 분석을 실시하고자 한다.
이에 따라 일반적으로는 단일 상품에 대한 가격은 가격 분할 구간 중, 인접한 몇 개 구간에 몰려있을 개연성이 크며, 군집 분석을 적용하여 서로 유사한 가격 벡터를 군집화할 경우, 가격의 분포 구간이 비슷한 상품들이 같은 군집을 형성하게 되고, 이러한 군집의 중심점(centroid)을 계산할 경우, 해당 군집 내 상품들이 일반적으로 분포하는 인접한 가격 구간들을 식별할 수 있다. 본 논문에서는 이렇게 식별된 가격 구간들을 해당 군집 소속 상품들의 주요 가격대로 제시한다.
본 논문에서는 특정 물품 카테고리 내 상품들의 주요 가격대를 탐색하는 방법을 제안하고자 한다. 주요 가격대란 특정 제품 카테고리 내 많은 상품들의 가격이 분포하는 가격 범위를 의미하는 것으로, 이러한 정보는 특정 물품 카테고리에 관심을 가진 소비자가 카테고리 내 상품 검색 범위를 좁히는데 도움이 될 것으로 생각된다.
본 논문에서는 하나의 물품 카테고리 내에서 많은 물품들이 관찰되는 주요 가격대를 추출하여 소비자들에게 제시함으로서 소비자들이 예산을 조정하고 구체적으로 검색 대상 상품을 좁혀나가는데 도움을 주기 위한 방법을 제안하고자 한다. 이러한 목적을 위하여 카테고리 내 각 물품의 가격 분포 정보를 적절한 형태로 나타내고, 대표적인 데이터마이닝 기법 중의 하나인 k-means 군집 방법[13]이 적용된다.
반대로 s_k, f_k가 각각 r_min, r_max에서 점점 멀어질수록 상품 k는 가격대 R로 특징짓기 부적합하다. 이 점을 반영하여 본 논문에서는 (2)와 같은 부적합도 지표를 통해 임의의 상품 k에 대한 가격대 R의 적합성을 측정하고자 한다.
하지만 이러한 사이트 제시 가격대에는 여전히 최저가만을 이용한다는 단점이 존재하고, 가격대들을 어떻게 추출할 것인지에 대한 고려가 부족하며, 최저가가 하위 가격대에 속하는 상품이라도 실제로는 그보다 상위 가격대에서 취급되거나 하는 경우가 빈번하다. 이러한 맥락에서 본 논문에서는 한 개 물품 카테고리에 대하여 어떤 가격대를 추출하여 소비자에게 제시하는 것이 바람직한가에 대하여 논의해보고, 바람직한 주요 가격대 추출 방법을 제안하고자 한다.
이에 따라, 본 논문에서는 온라인 쇼핑에서 동일 카테고리로 분류된 상품들의 가격 분포를 고려하여 비슷한 상품들의 가격 분포를 의미하는 주요 가격대를 추출하는 것이 필요하다는 것을 지적하고, 가격대 분류 평가 방법과 함께 주요 가격대 추출 방법을 제안하였다. 실험 결과, 현재 사용되는 등간격의 가격대와 상품 최저가를 이용한 필터링에서 동일 그룹 내에 가격 분포가 상이한 상품들이 함께 소속되는 경우가 많은 반면, 이렇게 추출된 주요 가격대 기준으로 동일 그룹에 소속된 상품들끼리는 전체적인 가격 분포가 유사하다는 점을 볼 수 있었고, 이러한 측면에서 주요 가격대는 온라인 쇼핑몰 방문자의 구매 의사결정 과정을 보다 효과적으로 지원할 수 있을 것으로 기대된다.
일례로 노트북 컴퓨터를 구매하려고 하나, 이 물품 카테고리에 대한 사전 지식이 없는 소비자를 가정해보자. 인터넷을 통하여 관련 정보를 수집하는 경우, 이 소비자는 옥션[1]이나 지마켓[9] 등과 같은 통합 온라인 쇼핑몰이나 다나와[4] 같은 가격 비교 사이트 또는 일반 포털 사이트의 쇼핑 정보를 참조하게 될 것이다.

가설 설정

이러한 가격 벡터 형태의 분산 가격 정보를 갖는 상품 k를 어떤 가격대 R = [r_min, r_max]에 소속시켰다고 가정해보자. 가격 벡터 p_k에서 0이 아닌 값을 갖는 원소 중 가장 낮은 구간의 시작값을 s_k, 가장 높은 구간의 종료값을 f_k라고 할 때, 상품 k에 대한 가격대 R의 적합성은 s_k = r_min, f_k = r_max일 때 가장 높다.

제안 방법

앞에서는 상품 가격대들이 주어지는 경우, 그에 대한 평가지표로 전체 부적합도를 제안하였다. 이제, 물품 카테고리 내에서 상품 가격대의 개수 및 각각의 범위를 정하는 방법이 필요하다.
본 논문은 2장에서 현대 온라인 쇼핑 환경 및 쇼핑 에이전트에 대한 기존 문헌들에 대하여 간단히 소개하고, 3장에서 동일 카테고리 내 상품 정보를 다루는 방법과 함께, 주요 가격대를 추출하는 방법에 대해 설명한다. 이 과정에서 개별 상품의 분산된 가격을 벡터로 표시하고, 이 벡터들에 k-means 군집을 적용하며, 주요 가격대 추출 결과를 평가하기 위한 지표를 제안한다. 이어 4장에서는 실제 국내 가격 비교 사이트에서 수집한 울트라씬(ultra-thin) 노트북 카테고리에 이러한 방법을 적용한 결과에 대해 살펴보고, 끝으로 5장에서 결론 및 향후 연구 과제를 제시한다.
이제, 물품 카테고리 내에서 상품 가격대의 개수 및 각각의 범위를 정하는 방법이 필요하다. 전체 부적합도가 낮으려면, 가격 분포가 서로 비슷한 상품들이 함께 같은 가격대에 소속되어야 하기 때문에 본 논문에서는 (2)와 같이 추출한 가격 벡터에 군집 분석을 적용한다. 일반적으로 단일 상품에 대해 서로 다른 판매자가 상이한 가격을 제시하더라도 그 차이에는 어느 정도 한계가 있고, 판매자 별 제시 가격에 큰 차이가 있는 상품들이라면, 사양에 중대한 차이가 있어 서로 다른 상품으로 보는 것이 타당할 것이다.

대상 데이터

그 이유는 분포 길이가 짧은 경우, 특정 구간만을 너무 강조할 수 있으며, 분포 길이가 긴 상품이 분석에 포함될 경우에는 만들어진 군집의 중심점 벡터 역시 그 분포 범위가 지나치게 넓을 수 있기 때문이다. 따라서 본 논문에서는 분포 범위 길이가 평균값 5.56과 인접한 3^~6에 걸쳐 있는 42개 상품들의 가격 벡터를 이용하기로 한다. 참고로 가격 분포가 좁은 상품들의 경우에는 추후 추출된 주요 가격대에 적당히 분배하고, 가격 분포가 넓은 상품들은 두 개 이상의 상품으로 나누는 것을 고려해볼 수 있다.

이론/모형

실제 분석에는 대표적인 군집 분석 알고리즘 중 k-means 알고리즘을 사용하였고, 가격 벡터들은 군집 알고리즘을 적용하기 전에 한 차례 정규화 과정을 거치도록 하였다. 정규화는 가격 벡터에 포함된 원소들의 값을 카테고리 내 상품들의 해당 원소 최대값으로 나누어 실행하고, 이 작업은 특정 몇몇 구간에 대한 벡터의 원소값들이 군집 과정에서 지나치게 큰 영향력을 발휘하는 것을 제어하기 위한 절차이다.
본 논문에서는 하나의 물품 카테고리 내에서 많은 물품들이 관찰되는 주요 가격대를 추출하여 소비자들에게 제시함으로서 소비자들이 예산을 조정하고 구체적으로 검색 대상 상품을 좁혀나가는데 도움을 주기 위한 방법을 제안하고자 한다. 이러한 목적을 위하여 카테고리 내 각 물품의 가격 분포 정보를 적절한 형태로 나타내고, 대표적인 데이터마이닝 기법 중의 하나인 k-means 군집 방법[13]이 적용된다.

성능/효과

이 때 조회되는 상품들은 대부분 주요 가격대에서 일반적인 구매가 가능한 상품들이며, 기존의 등간격 가격대에서처럼 실제로는 다른 가격대에서 구매해야 하는 상품들이 없다. 끝으로, [표 2]의 정보를 이용하지 않고, 기존의 등간격 가격대나 최저가 기준 정렬 등을 통하여 특정 상품 정보를 조회하는 고객의 경우, 해당 상품과 같은 주요 가격대에 속하는 상품들을 함께 추천하여 고객이 관심있어 하는 상품과 가격 분포가 비슷한 것들을 제시하는 것이 가능하다.
선택된 상품들의 가격 벡터 원소들의 값을 각각 해당 구간에서의 최대값으로 나누어 정규화한 후, 정규화 가격 벡터들에 k값을 2에서부터 늘려가며 k-means 알고리즘을 적용한 결과, k=6일 때 각 군집의 평균적인 분포가 어느 정도 인접한 구간들로 모이는 것을 볼 수 있었다. 따라서 이 물품 카테고리의 상품들의 경우, 6개 정도의 가격대를 식별하여 주는 것이 바람직하다는 점을 알 수 있고, 이 때, 얻어진 6개의 군집 중, 첫 번 째 군집에 소속된 상품들의 정규화 가격 벡터가 [표 4]에 예시로 나와있다.
이에 따라, 본 논문에서는 온라인 쇼핑에서 동일 카테고리로 분류된 상품들의 가격 분포를 고려하여 비슷한 상품들의 가격 분포를 의미하는 주요 가격대를 추출하는 것이 필요하다는 것을 지적하고, 가격대 분류 평가 방법과 함께 주요 가격대 추출 방법을 제안하였다. 실험 결과, 현재 사용되는 등간격의 가격대와 상품 최저가를 이용한 필터링에서 동일 그룹 내에 가격 분포가 상이한 상품들이 함께 소속되는 경우가 많은 반면, 이렇게 추출된 주요 가격대 기준으로 동일 그룹에 소속된 상품들끼리는 전체적인 가격 분포가 유사하다는 점을 볼 수 있었고, 이러한 측면에서 주요 가격대는 온라인 쇼핑몰 방문자의 구매 의사결정 과정을 보다 효과적으로 지원할 수 있을 것으로 기대된다.
이렇게 얻어진 주요 가격대 및 관련 정보는 다양한 방법으로 실제 온라인 쇼핑몰 방문자의 구매 의사결정을 지원할 수 있다. 첫째, 온라인 쇼핑몰 방문자가 특정 물품 카테고리를 선택할 경우, [표 5]와 같은 정보를 우선적으로 제시함으로서 고객들로 하여금 해당 카테고리 내 상품들이 대강 어떤 가격대에 주로 분포하는지를 알려주어 구매 예산 수립에 도움을 줄 수 있다. 두 번째로 방문자가 [표 5]를 보고 특정 주요 가격대를 선택할 경우, 소속 상품들의 목록을 보여주는 것을 생각해볼 수 있다.

후속연구

나아가, 주요 가격대를 특정 물품 카테고리를 선택한 소비자에게 제시하여, 소비자가 해당 카테고리 내의 상품들이 주로 어떤 가격대들에 분포하고 있는지를 파악할 수 있으며, 자신의 예산이나 구매 용도에 맞는 주요 가격대를 선택하여 보다 효과적으로 상품 정보를 검색 및 수집하는데 사용할 수 있을 것으로 기대된다.
아울러, k-means 군집 알고리즘을 사용하여 산출된 주요 가격대들은 서로 중첩되는 경우가 많이 발생하였는데, 이는 소비자들이 한 눈에 주요 가격대 중 자신에 가장 맞는 것을 선택하는데 있어 혼란을 줄 수 있다. 따라서 향후에는 기존의 균일한 가격대처럼 가격을 이산화할 수 있는 주요 가격대 산출 방법에 대한 연구가 필요할 것으로 생각된다.

질의응답

핵심어	질문	논문에서 추출한 답변
	주요 가격대란 무엇인가?	본 논문에서는 특정 물품 카테고리 내 상품들의 주요 가격대를 탐색하는 방법을 제안하고자 한다. 주요 가격대란 특정 제품 카테고리 내 많은 상품들의 가격이 분포하는 가격 범위를 의미하는 것으로, 이러한 정보는 특정 물품 카테고리에 관심을 가진 소비자가 카테고리 내 상품 검색 범위를 좁히는데 도움이 될 것으로 생각된다.
	온라인 쇼핑의 장점은 무엇인가?	이용의 편의성, 저렴한 가격 및 다양한 제품 정보에 대한 높은 접근성 등의 장점으로 인하여 온라인 쇼핑이 활성화된 지 오래이다[11][15][16]. 이에 따라 인터넷을 통해 일반 소비자들에게 물품을 판매하는 다양한 온라인 소매상들이 출현하였고, 최근에는 이들이 취급하는 물품들에 대한 정보를 편리하게 취합하여 조회할 수 있는 통합 온라인 쇼핑몰이나, shopbot 또는 비교 쇼핑 에이전트(comparative shopping agent)를 활용한 가격 비교 사이트를 통해 구매 전 관심 물품에 대한 정보를 수집하는 경우도 많아졌다[10].
	온라인 쇼핑이 활성화되면서 생긴 것들로 무엇이 있는가?	이용의 편의성, 저렴한 가격 및 다양한 제품 정보에 대한 높은 접근성 등의 장점으로 인하여 온라인 쇼핑이 활성화된 지 오래이다[11][15][16]. 이에 따라 인터넷을 통해 일반 소비자들에게 물품을 판매하는 다양한 온라인 소매상들이 출현하였고, 최근에는 이들이 취급하는 물품들에 대한 정보를 편리하게 취합하여 조회할 수 있는 통합 온라인 쇼핑몰이나, shopbot 또는 비교 쇼핑 에이전트(comparative shopping agent)를 활용한 가격 비교 사이트를 통해 구매 전 관심 물품에 대한 정보를 수집하는 경우도 많아졌다[10].

참고문헌 (16)

http://www.auction.co.kr
M. T. Baye, J. Morgan, and P. Scholten, "Price Dispersion in the Small and in the Large: Evidence from an Internet Price Comparison Site," The Journal of Industrial Economics, Vol.52, No.4, pp.463-496, 2004.

상세보기
M. R. Baye, J. Morgan, and P. Scholten, "Temporal Price Dispersion: Evidence from an Online Consumer Electronics Market," Journal of Interactive Marketing, Vol.18, No.4, pp.101-115, 2004.

상세보기
http://www.danawa.com
R. Garfinkel, R. Gopal, B. Pathak, and F. Yin, "Shopbot2.0: Integrating Recommendation and Promotions with Comparison Shopping," Decision Support Systems, Vol.46, No.1, pp.61-69, 2008.

상세보기
R. Garfinkel, R. Gopal, A. Tripathi, and F. Yin, "Design of a Shopbot and Recommender System for Bundle Purchases," Decision Support Systems, Vol.42, No.3, pp.1974-1986, 2006.

상세보기
M. Haynes and S. Thompson, "Price, Price Dispersion and Number of Sellers at a Low Entry Cost Shopbot," International Journal of Industrial Organization, Vol.26, No.2, pp.459-472, 2008.

상세보기
S. Y. Hong, J. W. Kim, and Y. H. Hwang, "Fuzzy-Semantic Information Management System for Dispersed Web Information," Journal of Computer Information Systems, Vol.52, No.1, pp.96-105, 2011.
http://www.gmarket.co.kr
G. G. Lim, J. Y. Kang, J. K. Lee, and D. C. Lee, "Rule-based Personalized Comparison Shopping Including Delivery Cost," Electronic Commerce Research and Applications, Vol.10, No.6, pp.637-649, 2011.

상세보기
M. Limayem, M. Khalifa, and A. Frini, "What Makes Consumers Buy from Internet? A Longitudinal Study of Online Shopping," IEEE Transactions on Systems, Man, and Cybernetics - Part A: Systems and Humans, Vol.30, No.4, pp.421-432, 2000.

상세보기
B. Pathak, "A Survey of the Comparison Shopping Agent-based Decision Support Systems," Journal of Electronic Commerce Research, Vol.11, No.3, pp.178-192, 2010.
P. N. Tan, M. Steinbach, and V. Kumar, Introduction to Data Mining, Addison Wesley, 2005.
F. Vachon, "Can Online Aids Support Non-cognitive Web Shopping Approaches?," International Journal of Business and Management, Vol.6, No.10, pp.16-27, 2011.
강대기, 이제선, 함호상, "웹 상의 온라인 비교 쇼핑을 위한 상품 정보 자동 색인 및 검색 시스템의 설계 및 구현에 대한 연구," 한국CALS/EC학회지, 제3권, 제2호, pp.57-71, 1998.

원문보기 상세보기
김경희, "인터넷 쇼핑가치, 점포이미지와 고객만족 및 재방문의도 - 구매제품유형별 비교," 한국콘텐츠학회논문지, 제8권, 제3호, p.173-181, 2008.

원문보기 상세보기

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증