기업은 소비자가 만족하는 제품을 개발하고 개선하기 위하여 설문조사와 같은 전통적인 마케팅리서치 방법을 이용하여, 소비자의 의견을 듣고, 분석하여 반영하는 노력을 한다. 최근에는 인터넷 사이트, 사회관계망(SNS) 등 소비자 커뮤니케이션 플랫폼에서 관련 자료를 수집하고 분석하는 방법이 주목을 받고 있다. 한편, 급속한 정보통신기술의 발달과 함께 이동통신사들이 아동을 위한 디지털상품을 출시하고 있는데, 특히 유해한 콘텐츠로부터 아동을 보호하고, 부모와 아동들에게 필요한 정보와 기능은 보완된 디지털 디바이스들이 등장하고 있다. 이 가운데 키즈폰은 불필요한 기능은 없애고 아동들에게 기본 안전 기능을 담은 웨어러블 디바이스로서 부모가 쉽게 자녀의 위치를 실시간으로 알게 해주는 유용한 도구이다. 키즈폰은 스마트폰에 비해 저렴하고 간편하지만 고장이 잦고, 안전 이외에 유용한 기능을 기대하기 힘들며, 부가적인 기능들 또한 유용하지 못하다는 점이 지적되고 있다. 본 연구는 국내 이동통신사의 키즈폰(Kids Phone)에 대한 리뷰를 분석하여, 제품들의 특성과 장단점을 파악하고, 디바이스와 서비스에 대한 개선방안을 제안함으로써, SNS 소비자 분석을 통한 제품 서비스 개선 전략수립 방법을 제시하고자 한다. 이를 위해 국내 쇼핑몰의 리뷰 섹션에서 자료를 수집하고, TF/IDF, 감성분석, 네트워크분석 등의 텍스트 마이닝 기법을 활용하여 소비자 감성분석을 실시하였다. 고객 리뷰는 온라인 쇼핑몰과 네이버 블로그에서 크롤링하여 수집 하였으며, 통계/데이터 마이닝 및 그래픽은 'R'과 빅데이터 분석 솔루션 'Textom', 그리고 오픈소스 프로그래밍 언어인 'Python'을 함께 사용하여 분석하고 시각화하였다. 본 연구를 통해 각 이동통신사의 현재 제품(키즈폰)에 대한 소비자가 느끼는 주요이슈와 제품의 장단점을 파악할 수 있었으며, 더 나아가 감성분석을 바탕으로 키즈폰 제품의 서비스 개선전략 방향을 제안할 수 있었다.
기업은 소비자가 만족하는 제품을 개발하고 개선하기 위하여 설문조사와 같은 전통적인 마케팅리서치 방법을 이용하여, 소비자의 의견을 듣고, 분석하여 반영하는 노력을 한다. 최근에는 인터넷 사이트, 사회관계망(SNS) 등 소비자 커뮤니케이션 플랫폼에서 관련 자료를 수집하고 분석하는 방법이 주목을 받고 있다. 한편, 급속한 정보통신기술의 발달과 함께 이동통신사들이 아동을 위한 디지털상품을 출시하고 있는데, 특히 유해한 콘텐츠로부터 아동을 보호하고, 부모와 아동들에게 필요한 정보와 기능은 보완된 디지털 디바이스들이 등장하고 있다. 이 가운데 키즈폰은 불필요한 기능은 없애고 아동들에게 기본 안전 기능을 담은 웨어러블 디바이스로서 부모가 쉽게 자녀의 위치를 실시간으로 알게 해주는 유용한 도구이다. 키즈폰은 스마트폰에 비해 저렴하고 간편하지만 고장이 잦고, 안전 이외에 유용한 기능을 기대하기 힘들며, 부가적인 기능들 또한 유용하지 못하다는 점이 지적되고 있다. 본 연구는 국내 이동통신사의 키즈폰(Kids Phone)에 대한 리뷰를 분석하여, 제품들의 특성과 장단점을 파악하고, 디바이스와 서비스에 대한 개선방안을 제안함으로써, SNS 소비자 분석을 통한 제품 서비스 개선 전략수립 방법을 제시하고자 한다. 이를 위해 국내 쇼핑몰의 리뷰 섹션에서 자료를 수집하고, TF/IDF, 감성분석, 네트워크분석 등의 텍스트 마이닝 기법을 활용하여 소비자 감성분석을 실시하였다. 고객 리뷰는 온라인 쇼핑몰과 네이버 블로그에서 크롤링하여 수집 하였으며, 통계/데이터 마이닝 및 그래픽은 'R'과 빅데이터 분석 솔루션 'Textom', 그리고 오픈소스 프로그래밍 언어인 'Python'을 함께 사용하여 분석하고 시각화하였다. 본 연구를 통해 각 이동통신사의 현재 제품(키즈폰)에 대한 소비자가 느끼는 주요이슈와 제품의 장단점을 파악할 수 있었으며, 더 나아가 감성분석을 바탕으로 키즈폰 제품의 서비스 개선전략 방향을 제안할 수 있었다.
In order to come up with satisfying product and improvement, firms use traditional marketing research methods to obtain consumers' opinions and further try to reflect them. Recently, gathering data from consumer communication platforms like internet and SNS has become popular methods. Meanwhile, wit...
In order to come up with satisfying product and improvement, firms use traditional marketing research methods to obtain consumers' opinions and further try to reflect them. Recently, gathering data from consumer communication platforms like internet and SNS has become popular methods. Meanwhile, with the development of information technology, mobile companies are launching new digital products for children to protect them from harmful content and provide them with necessary functions and information. Among these digital products, Kids Phone, which is a wearable device with safe functions that enable parents to learn childern's location. Kids phone is relatively cheaper and simpler than smartphone but it is noted that there are several problems such as some useless functions and frequent breakdowns. This study analyzes the reviews of Kids phones from domestic mobile companies, identifies the characteristics, strengths and weaknesses of the products, proposes improvement methods strategies for devices and services through SNS consumer analysis. In order to do that customer review data from online shopping malls was gathered and was further analyzed through text mining methods such as TF/IDF, Sentiment Analysis, and network analysis. Customer review data was gathered through crawling Online shopping Mall and Naver Blog/$Caf\acute{e}$. Data analysis and visualization was done using 'R', 'Textom', and 'Python'. Such analysis allowed us to figure out main issues and recent trends regarding kids phones and to suggest possible service improvement strategies based on sentiment analysis.
In order to come up with satisfying product and improvement, firms use traditional marketing research methods to obtain consumers' opinions and further try to reflect them. Recently, gathering data from consumer communication platforms like internet and SNS has become popular methods. Meanwhile, with the development of information technology, mobile companies are launching new digital products for children to protect them from harmful content and provide them with necessary functions and information. Among these digital products, Kids Phone, which is a wearable device with safe functions that enable parents to learn childern's location. Kids phone is relatively cheaper and simpler than smartphone but it is noted that there are several problems such as some useless functions and frequent breakdowns. This study analyzes the reviews of Kids phones from domestic mobile companies, identifies the characteristics, strengths and weaknesses of the products, proposes improvement methods strategies for devices and services through SNS consumer analysis. In order to do that customer review data from online shopping malls was gathered and was further analyzed through text mining methods such as TF/IDF, Sentiment Analysis, and network analysis. Customer review data was gathered through crawling Online shopping Mall and Naver Blog/$Caf\acute{e}$. Data analysis and visualization was done using 'R', 'Textom', and 'Python'. Such analysis allowed us to figure out main issues and recent trends regarding kids phones and to suggest possible service improvement strategies based on sentiment analysis.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서, 키즈폰을 대상으로 온라인 소비자리 뷰를 크롤링하여 감성분석을 실시한 후, 그 결 과를 바탕으로 상품의 개선 더 나아가 가치사슬 활동에서 개선 가능한 전략을 제시해보고자 한다. 구체적으로 키즈폰을 판매하고 있는 주요 온라인 쇼핑몰과 SNS에 작성한 리뷰를 수집하여 분석하기 위해, 먼저 키즈폰에 대한 온라인 리뷰를 크롤링하여 초기 데이터를 수집한 후에 전처리를 통해 정제하는 과정을 거치고, 정제된 데이터를 대상으로 텍스트 마이닝 기법을 사용하여 분석을 실시하였다.
본 연구에서는 블로그와 카페의 게시물 중 ‘키즈폰’이라는 단어를 포함하고 있는 게시물 중 분석을 시작한 2018년 5월을 기점으로 가장 최근에 작성된 2,000건의 게시물만 수집하였는데 이는 블로그와 카페의 경우 워낙 양이 방대하며 키 즈폰과 같은 전자제품의 특성 상 이전 제품의 단점을 보완한 신제품이 수시로 나오기 때문이다. 또한 다방면의 분석보다는 키즈폰이라는 제품에 대한 전반적인 인식과 시장의 흐름을 간략하기 확인해보기 위해 위와 같은 수집 방식을 택했다.
[18]은 감성분석의 분석과정을 단순화 하기 위해 TF-IDF를 응용하여 데이터를 2차원으로 사상하고 이를 기반으로 SVM을 구축하기도 하였다[18]. 본 논문에서는 우선 빈도 분석으로 전체 리뷰 내에서 어떤 단어가 빈번하게 나타나는지 확인한 후, 그 단어들의 가중치를 계산해 보았다.
이 같은 프레임워크에서는 주로 기존의 학술적 연구들을 수집목적과 데이터소스, 전처리기법, 분석기법과 활동 등에 따라서 분류 및 정리하기 위한 개념적 프레임워크에 가까워 실무적인 함의들을 도출하기 어려웠다. 본 연구에서는 온라인 리뷰분석의 결과가 실제 현업의 전략개발에 있어서 어떻게 활용될 수 있는지에 대해 연구 분석하고자 한다. 특히, 본 연구가 분석하고자하는 ‘키즈폰’의 경우, 비교적 일반인들에게는 새로운 스마트 디바이스 제품으로써, 고객들이 보다 더 적극적으로 구매결정을 위한 정보를 온라인리뷰에서 찾는 경향을 갖고 있기 때문에 기업입장에서 리뷰를 통한 실무적 시사점들을 많이 도출할 수 있을 것이라 기대한다.
본 연구에서는 위의 텍스트 분석 결과가 실제로 기업 활동의 의사결정 개선 및 제품개선 활동 전략개선에 어떤 도움을 줄 수 있는지 실무적 활용을 위한 함의점을 이끌어내기 위하여, [Figure 10]과 같이 분석을 통해 나온 단어들 중 높은 빈도를 보인 단어들을 가치사슬 내 활동들인 기업 인프라(Firm Infrastructure), 인적 자원 관리(Human Resource Management), 기술 개발(Technology Development), 조달 활동(Procurement), 원자재 투입(Inbound Logistics), 운영(Operations), 출고(Outbound Logistics), 마케팅 및 판매(Marketing & Sales), 그리고 서비스 활동(Service)에 연관시켜보고자 하였다.
기업은 기업에서 경쟁전략을 세우기 위해, 자신의 경쟁적 지위를 파악하고 이를 향상시킬 수 있는 지점을 찾기 위해 가치사슬이라는 모형을 이용한다. 본 연구에서는 키즈폰 리뷰 데이터에 대한 텍스트 마이닝을 통해 나온 단어들을 가치사슬 내의 기업활동과 연관지음으로써 어떤 부분에서의 개선이 필요한지 확인하고자 한다.
구체적으로 키즈폰을 판매하고 있는 주요 온라인 쇼핑몰과 SNS에 작성한 리뷰를 수집하여 분석하기 위해, 먼저 키즈폰에 대한 온라인 리뷰를 크롤링하여 초기 데이터를 수집한 후에 전처리를 통해 정제하는 과정을 거치고, 정제된 데이터를 대상으로 텍스트 마이닝 기법을 사용하여 분석을 실시하였다. 분석 결과로부터 제품의 장단점을 분석하여, 제품 자체의 보완이나 개선, 서비스 측면의 보완이나 개선 방안을 찾고자 하였다.
수집한 데이터에 대해 네트워크 분석을 위한 단어의 선정에 있어 연구자의 주관성이 개입될 수밖에 없기에 데이터 정제과정에서는 연구자의 주관이 개입된 의미론적 정제를 위한 제거와 변경을 최소화 하였고 최대한 데이터의 오류와 스팸 등만을 잡아내고자 하였다. 이러한 정제를 통해 1차 데이터의 수집량과 수집된 데이터의 텍스트 양을 축약하였다.
본 연구에서는 위의 텍스트 분석 결과가 실제로 기업 활동의 의사결정 개선 및 제품개선 활동 전략개선에 어떤 도움을 줄 수 있는지 실무적 활용을 위한 함의점을 이끌어내기 위하여, [Figure 10]과 같이 분석을 통해 나온 단어들 중 높은 빈도를 보인 단어들을 가치사슬 내 활동들인 기업 인프라(Firm Infrastructure), 인적 자원 관리(Human Resource Management), 기술 개발(Technology Development), 조달 활동(Procurement), 원자재 투입(Inbound Logistics), 운영(Operations), 출고(Outbound Logistics), 마케팅 및 판매(Marketing & Sales), 그리고 서비스 활동(Service)에 연관시켜보고자 하였다. 이는 텍스트마이닝에서 도출된 중요 키워드가 어떻게 개별 가치 사슬 내의 활동에 영향을 주고 실제 가치 활동 개선에 도움을 줄 수 있는지 보여주기 위함이다. 수집한 실제 리뷰 중 ‘배터리 너무 빨리 닳고 교환했는데도 성능이 별로다’, ‘배터리 성능이 안좋다’와 같은 리뷰를 수집, 확인하였고 데이터가 축적됨에 따라 ‘배터리’, ‘성능’이 수집한 데이터에서 높은 빈도를 보이며 Keyword로 인식될 것이다.
제안 방법
감성 분석의 경우 긍정 부정을 나누는 기준은 연구자가 임의로 수집한 리뷰 데이터를 수동으로 트레이닝 세트를 구성하여 학습시켜 베이지안 분류기(Bayes Classifier)를 통한 감성 분석을 실시하였다.
감성분석에서 중립 또는 부정적으로 판단된 리뷰들에 대해 다시 TF와 TF-IDF 분석을 진행하였다. S사와 K사 제품의 중립과 부정적 리뷰의 TF 분석은 [Table 3]과 같았다.
따라서, 키즈폰을 대상으로 온라인 소비자리 뷰를 크롤링하여 감성분석을 실시한 후, 그 결 과를 바탕으로 상품의 개선 더 나아가 가치사슬 활동에서 개선 가능한 전략을 제시해보고자 한다. 구체적으로 키즈폰을 판매하고 있는 주요 온라인 쇼핑몰과 SNS에 작성한 리뷰를 수집하여 분석하기 위해, 먼저 키즈폰에 대한 온라인 리뷰를 크롤링하여 초기 데이터를 수집한 후에 전처리를 통해 정제하는 과정을 거치고, 정제된 데이터를 대상으로 텍스트 마이닝 기법을 사용하여 분석을 실시하였다. 분석 결과로부터 제품의 장단점을 분석하여, 제품 자체의 보완이나 개선, 서비스 측면의 보완이나 개선 방안을 찾고자 하였다.
먼저, 수집한 텍스트에서 TF와 TF-IDF 분석을 통해 특정 단어의 빈도 수와 텍스트 내에서의 중요도를 확인하여 소비자들의 전반적인 의견에 대해 살펴보았다. 그 후, 감성 분석을 통해 제품에 대한 소비자의 심리를 살펴보고, 감성 분석을 통해 긍정으로 나온 리뷰와 부정 또는 중립으로 나온 리뷰를 구분하여 네트워크 분석을 실시함으로써 장점과 단점을 명확히 파악하고자 하였다.
네이버 블로그와 카페에서 ‘키즈폰’이라는 단어로 검색하여 수집한 데이터들에 대해서는 TF 분석만 실시하여 여러 제품들의 특성을 확인하기 보다는 키즈폰이라는 새로운 특정 제품이 가지는 특성을 살펴보았다.
둘째, 감성분석을 통해 K사와 S사 제품에 대 한 소비자들의 만족 정도를 평가해 보았다. 각 제품에 대한 상품평을 분류하여 해당 상품평들 에 대한 감성분석을 실시한 결과, 두 제품 모두 긍정이 90% 이상으로 나타나 키즈폰에 대한 두 통신사의 전반적인 만족도는 매우 높게 나타났 다.
전처리와 정제를 통해 데이터의 오류를 잡아내며 데 이터의 양을 줄일 수 있었다. 리뷰 데이터에 대한 분석은 텍스트 마이닝 기법을 사용하였 으며 그 중 TF/TF-IDF, 감성 분석, N-gram을 중점적으로 이용하였다. 분석을 통해 나온 결과를 정리하였고, 활용 방안과 한계점을 도출할 수 있었다.
먼저, 수집한 텍스트에서 TF와 TF-IDF 분석을 통해 특정 단어의 빈도 수와 텍스트 내에서의 중요도를 확인하여 소비자들의 전반적인 의견에 대해 살펴보았다. 그 후, 감성 분석을 통해 제품에 대한 소비자의 심리를 살펴보고, 감성 분석을 통해 긍정으로 나온 리뷰와 부정 또는 중립으로 나온 리뷰를 구분하여 네트워크 분석을 실시함으로써 장점과 단점을 명확히 파악하고자 하였다.
보다 유효한 자료를 대상으로 분석하기 위하여 네이버 블로그와 카페, 온라인 쇼핑몰 리뷰에 나타난 비정형 텍스트를 Python과 The IMC의 Textom 프로그램을 이용하여 정제하였다.
본 연구에서는 키즈폰의 개선 또는 신규 개발을 위한 전략도출을 위하여 기존 제품에 대 한 온라인 소비자리뷰를 포털 및 온라인 쇼핑 사이트에서 수집하여 전처리를 통해 정제한 후, 텍스트 마이닝 기법을 사용하여 분석함으로써 [Figure 9]와 같은 결론을 얻을 수 있었다.
제품 모두 긍정적인 감정이 90% 이상으로 나타나 구매자가 제품에 대해 대체로 만족하는 모습을 보인다는 것을 확인했다. 비록 긍정적인 리뷰가 소비자의 의사결정에 가장 큰 영향을 끼치지만, 부정적인 리뷰를 작성한 구매자가 보다 명확한 정보를 제공한다는 선행 연구에 따라 제품의 특성을 확인하기 위해 긍정을 제외한 부정과 중립 감정을 나타낸 리뷰 데이터들을 분리하여 분석해 보았다.
블로그 및 카페에 작성한 리뷰 데이터와 온라인 쇼핑몰에 작성한 K사, S사 제품에 대한 리뷰 데이터에 대해 빈도분석 및 TF-IDF를 진 행하였다. 빈도 분석은 텍스트에 포함된 단어 중 상위 200개의 단어만 반영하도록 하였다.
셋째, 네트워크 분석을 통해 단어 간의 연관성과 내재된 의미를 확인해보았다. 전체 리뷰에 대한 네트워크 그래프에서는 ‘배송’이 네트워크의 중심이 되어 다른 단어와 연결됨에 따라, 제품이 고객에게 전달되는 과정 또한 중요한 전자상거래의 특성을 잘 보여주고 있다.
수집된 데이터의 분석 단계에서의 오류를 줄이기 위해 단어를 제거, 통합, 변경하는 정제 작업을 진행하였다. 예를 들어, ‘~’와 ‘^^’같은 특수 문자와 ‘으로’와 같은 격조사와 같이 제품의 특성이나 서비스와는 무관한 단어들을 제거하였다.
온라인 쇼핑몰 리뷰의 특성이 아닌 제품의 특성을 알아보기 위하여 G마켓과 11번가의 데이터로 나누지 않고 두 개의 데이터를 합친 후 각 이동통신사의 제품별로 나누었다. 이 과정에서 국내 3대 통신사중 L사의 경우 비교적 최근에 키즈폰 시장에 진입하여 판매된 제품에 대한 소비자리뷰를 찾을 수 없었기에 제외하고, K사와 S사로만 분류하여 정리하였다.
네이버 블로그와 카페에서 ‘키즈폰’이라는 단어로 검색하여 수집한 데이터들에 대해서는 TF 분석만 실시하여 여러 제품들의 특성을 확인하기 보다는 키즈폰이라는 새로운 특정 제품이 가지는 특성을 살펴보았다. 온라인 쇼핑몰에서 수집한 K사 키즈폰과 S사 키즈폰에 대한 온라인 리뷰는 위에 언급한 모든 기법을 적용해 보았다.
‘섭스’와 ‘간사’와 같이 맞춤법이 틀린 단어들은 원문을 확인하여 ‘서비스’와 ‘감사’로 바르게 표기하는 방식으로 변경하였다. 온라인 쇼핑몰의 리뷰는 이러한 리뷰들의 내용적 특성뿐만 아니라 작성일과 작성자의 비교도 진행하였다. 한 날짜에 한 명의 작성자가 내용의 변경 없이 3번 이상 작성한 리뷰의 경우 오류 또는 스팸으로 간주하여 한 개의 리뷰만 채택하여 수집하였다.
네트워크 그래프와 더불어 워드트리를 사용하여 빈번히 사용되는 단어들의 조합을 통해 제품적 특성과 서비스 정도에 대해 유추가 가능하였다. 워드트리에는 1-Way 워드트리, 2-Way 워드트리가 있는데 본 분석에서는 N-Gram 결과를 시각화 할 수 있는 1-Way 워드트리로 시각화하였다. 데이터 내에서 왼쪽에 있는 단어가 등장 했을 때, 높은 확률로 오른쪽에 위치한 단어가 연속적으로 등장함을 나타낸다.
수집한 데이터에 대해 네트워크 분석을 위한 단어의 선정에 있어 연구자의 주관성이 개입될 수밖에 없기에 데이터 정제과정에서는 연구자의 주관이 개입된 의미론적 정제를 위한 제거와 변경을 최소화 하였고 최대한 데이터의 오류와 스팸 등만을 잡아내고자 하였다. 이러한 정제를 통해 1차 데이터의 수집량과 수집된 데이터의 텍스트 양을 축약하였다.
텍스트 마이닝 기법 중에서 TF(Term-frequency), TF-IDF, 감성분석, 네트워크 분석을 사용하였다. 네이버 블로그와 카페에서 ‘키즈폰’이라는 단어로 검색하여 수집한 데이터들에 대해서는 TF 분석만 실시하여 여러 제품들의 특성을 확인하기 보다는 키즈폰이라는 새로운 특정 제품이 가지는 특성을 살펴보았다.
온라인 쇼핑몰의 리뷰는 이러한 리뷰들의 내용적 특성뿐만 아니라 작성일과 작성자의 비교도 진행하였다. 한 날짜에 한 명의 작성자가 내용의 변경 없이 3번 이상 작성한 리뷰의 경우 오류 또는 스팸으로 간주하여 한 개의 리뷰만 채택하여 수집하였다.
대상 데이터
‘키즈폰’이라는 키워드로 검색해서 나오는 제품들 중 휴대전화 카테고리에 속하는 제품들의 소비자리뷰만을 수집하였으며, 텍스트 마이닝 분석을 하기 위해 텍스트가 없는 리뷰는 제외하여 수집하였다.
‘키즈폰’이라는 키워드로 검색해서 나오는 제품들 중 휴대전화 카테고리에 속하는 제품들의 소비자리뷰만을 수집하였으며, 텍스트 마이닝 분석을 하기 위해 텍스트가 없는 리뷰는 제외하여 수집하였다. G마켓과 11번가에서는 2018년 5월까지 작성된 모든 리뷰를 수집하였고 그 결과 G마켓에서 508건, 11번가에서 353건의 구매 리뷰를 수집하였다.
본 연구에서 대상으로 하는 키즈폰에 대한 리뷰 데이터는 네이버 블로그와 카페, 그리고 온라인 쇼핑 사이트인 G마켓과 11번가에서 수집하였다.
본 연구에서는 블로그와 카페의 게시물 중 ‘키즈폰’이라는 단어를 포함하고 있는 게시물 중 분석을 시작한 2018년 5월을 기점으로 가장 최근에 작성된 2,000건의 게시물만 수집하였는데 이는 블로그와 카페의 경우 워낙 양이 방대하며 키 즈폰과 같은 전자제품의 특성 상 이전 제품의 단점을 보완한 신제품이 수시로 나오기 때문이다.
온라인 쇼핑몰사이트 리뷰는 G마켓과 11번가를 선택하여 수집하였다. 국내 오픈마켓의 시장 점유율을 살펴보면 2016년 9월 기준 G마켓이 38%, 11번가는 32%로 두 회사가 전체의 70%를 점유하는 것으로 나타났기에 키즈폰에 대한 소비자의 의견을 충분히 수집 가능하다고 판단했다.
키즈폰 제품에 대한 리뷰데이터를 국내 최대 포털사이트인 네이버와 온라인 쇼핑 사이 트인 G마켓과 11번가에서 수집하였다. 전처리와 정제를 통해 데이터의 오류를 잡아내며 데 이터의 양을 줄일 수 있었다.
데이터처리
블로그 및 카페에 작성한 리뷰 데이터와 온라인 쇼핑몰에 작성한 K사, S사 제품에 대한 리뷰 데이터에 대해 빈도분석 및 TF-IDF를 진 행하였다. 빈도 분석은 텍스트에 포함된 단어 중 상위 200개의 단어만 반영하도록 하였다.
첫째, 키즈폰에 대한 소비자의 전반적인 생각과 제품의 트렌드는 빈도분석과 TF-IDF 분석을 통해 파악할 수 있었다. 분석을 통해 나온 키워드는 ‘선물’, ‘안전’, ‘아이’ 등으로 키즈폰의 제품군은 주로 자녀를 가진 부모들이 아이들의 안전과 초등학교에 입학하는 자녀에게 주는 선물로 구매하는 제품군임을 재확인할 수 있었으며 기존의 스마트폰보다 보유한 기능은 적지만, 꼭 필요한 기능을 넣은 웨어러블 디바이스로 안전과 가성비를 모두 갖춘 제품으로 인식되고 있음을 확인하였다.
이론/모형
본 분석에는 빅데이터의 분석방법 중에서 텍스트 마이닝을 이용하였다.
본 연구에서도 온라인리뷰 분석을 위해 텍스트 마이닝 방법 중 일반적으로 리뷰분석에 많이 쓰이 는 TF/IDF(Term-Frequency-Inverse Document Frequency), Sentiment Analysis(감성분 석), N-gram 기법을 활용하였다. TF-IDF는 정보 검색과 텍스트 마이닝에서 이용하는 가중치로, 여러 문서로 이루어진 문서 군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다.
성능/효과
‘라인’(2,841.90), ‘판매’(1,727.01), ‘아이’(1,635.82), ‘사용’(1,432.39), ‘카카오’(1,430.77) 등의 단어가 높은 TF-IDF 값을 보이는 것을 확인할 수 있었다.
[Table 2]와 같이 두 제품 모두 TF-IDF 에서도 ‘배송’, ‘추천’, ‘사은품’ 등의 단어가 상위권에 위치함을 확인할 수 있었다.
둘째, 감성분석을 통해 K사와 S사 제품에 대 한 소비자들의 만족 정도를 평가해 보았다. 각 제품에 대한 상품평을 분류하여 해당 상품평들 에 대한 감성분석을 실시한 결과, 두 제품 모두 긍정이 90% 이상으로 나타나 키즈폰에 대한 두 통신사의 전반적인 만족도는 매우 높게 나타났 다. 긍정적 리뷰에서는 제품의 성능보다 빠른 배송, 친절한 상담, 사은품 등과 같이 서비스 측면의 만족도가 높은 것을 알 수 있었다.
각 제품에 대한 상품평을 분류하여 해당 상품평들 에 대한 감성분석을 실시한 결과, 두 제품 모두 긍정이 90% 이상으로 나타나 키즈폰에 대한 두 통신사의 전반적인 만족도는 매우 높게 나타났 다. 긍정적 리뷰에서는 제품의 성능보다 빠른 배송, 친절한 상담, 사은품 등과 같이 서비스 측면의 만족도가 높은 것을 알 수 있었다. 부정적 리뷰는 키즈워치에서 핵심기능으로 내세우는 위치 추적 기능이 원활히 작동하지 않거나 배터리, 방수 등의 문제에 불편함이 많은 것으로 나타났다.
네트워크 그래프와 더불어 워드트리를 사용하여 빈번히 사용되는 단어들의 조합을 통해 제품적 특성과 서비스 정도에 대해 유추가 가능하였다. 워드트리에는 1-Way 워드트리, 2-Way 워드트리가 있는데 본 분석에서는 N-Gram 결과를 시각화 할 수 있는 1-Way 워드트리로 시각화하였다.
긍정적 리뷰에서는 제품의 성능보다 빠른 배송, 친절한 상담, 사은품 등과 같이 서비스 측면의 만족도가 높은 것을 알 수 있었다. 부정적 리뷰는 키즈워치에서 핵심기능으로 내세우는 위치 추적 기능이 원활히 작동하지 않거나 배터리, 방수 등의 문제에 불편함이 많은 것으로 나타났다.
분석을 통해 나온 키워드는 ‘선물’, ‘안전’, ‘아이’ 등으로 키즈폰의 제품군은 주로 자녀를 가진 부모들이 아이들의 안전과 초등학교에 입학하는 자녀에게 주는 선물로 구매하는 제품군임을 재확인할 수 있었으며 기존의 스마트폰보다 보유한 기능은 적지만, 꼭 필요한 기능을 넣은 웨어러블 디바이스로 안전과 가성비를 모두 갖춘 제품으로 인식되고 있음을 확인하였다.
분석을 통해 나온 핵심 키워드들을 자동으로 분류해주는 알고리즘과 사전의 구축의 필요성이 확인되었다. 현재는 분석으로 나온 단어들을 연구자가 임의로 가치사슬 내의 활동에 지정하여 개선점을 제언하였지만 이 과정을 딥러닝의 텍스트분류, Summarization 기법으로 정기적으로 해당 가치사슬 내 활동 부서에 전달한다면, 제품의 분석, 소비자 의견 분석, 그리고 더 나아가 서비스의 프로세스에 대한 개선이 효율적으로 처리가 가능할 것이다.
수집한 실제 리뷰 중 ‘배터리 너무 빨리 닳고 교환했는데도 성능이 별로다’, ‘배터리 성능이 안좋다’와 같은 리뷰를 수집, 확인하였고 데이터가 축적됨에 따라 ‘배터리’, ‘성능’이 수집한 데이터에서 높은 빈도를 보이며 Keyword로 인식될 것이다.
온라인 쇼핑몰 리뷰의 빈도 분석에서는 S사 제품의 경우 ‘배송’(11.121%), ‘추천’(7.632’), ‘적극’(5.975%), ‘친절’(4.187%), ‘아이’(3.227%)의 순으로 나타나는 것을 확인할 수 있었으며, 이 외에도 ‘위치’(0.567%), ‘배터리’(0.305%) 등의 제품의 기능 관련 단어의 빈도를 확인할 수 있 었다.
우선 블로그와 카페의 빈도 분석에서는 ‘폰’(15.061%), ‘키즈’(13.262%), ‘라인’(2.55%’), ‘아이’(1.468%), ‘사용’(1.107%)의 순으로 나타나는 것을 확인할 수 있었다.
수집한 온라인 쇼핑몰 리뷰를 월별로 정리하면 [Figure 2]와 같은 양상을 확인할 수 있었다. 이를 통해 키즈폰에 대한 관심과 수요는 전반적으로 점차 증가하는 추세임을 확인할 수 있었다. 1년 단위로 관찰 했을 때는 자녀들이 학교에 입학하여 1학기를 시작하는 2~4월에 구매가 많음을 알 수 있다.
1단계에서 진한 보라색으로 나타난 단어들은 ‘위치’, ‘친절’, ‘불편’, ‘통화’로서 ‘위치’와 ‘통화’는 제품적 특성을 ‘친절’은 서비스적 측면을 설명하고 있다. 이를 통해, 키즈폰의 기능 중 위치 추적과 발송이 부정확함을 알 수 있고, 일반 스마트폰에 비해 통화의 품질이 떨어져 사용자들이 불편함을 겪고 있다는 것을 알 수 있었다. 서비스적 측면은 [Figure 7]에서와 마찬가지로 친절함과 빠른 배송으로 고객들에게 만족을 선사하고 있는 것으로 보여진다.
키즈폰 제품에 대한 리뷰데이터를 국내 최대 포털사이트인 네이버와 온라인 쇼핑 사이 트인 G마켓과 11번가에서 수집하였다. 전처리와 정제를 통해 데이터의 오류를 잡아내며 데 이터의 양을 줄일 수 있었다. 리뷰 데이터에 대한 분석은 텍스트 마이닝 기법을 사용하였 으며 그 중 TF/TF-IDF, 감성 분석, N-gram을 중점적으로 이용하였다.
제품 모두 긍정적인 감정이 90% 이상으로 나타나 구매자가 제품에 대해 대체로 만족하는 모습을 보인다는 것을 확인했다. 비록 긍정적인 리뷰가 소비자의 의사결정에 가장 큰 영향을 끼치지만, 부정적인 리뷰를 작성한 구매자가 보다 명확한 정보를 제공한다는 선행 연구에 따라 제품의 특성을 확인하기 위해 긍정을 제외한 부정과 중립 감정을 나타낸 리뷰 데이터들을 분리하여 분석해 보았다.
마지막으로 본 연구 분석을 통해 도출한 마지막 도출은 방수 및 내구성문제와 관련되어 있다. 제품 설명에는 생활 방수가 된다고 하지만 주 사용자가 어린이인 만큼 방수나 스크래치 등의 제품 훼손에 보다 잘못 견디는 부정리뷰를 발견할 수 있었다. 이는 제조업체가 스마트디바이스 내장된 기능에 치중하기 보다는 아이의 생활방식을 고려한 안전테스트 내구성에 치중하고 A/S등의 수리와 관련된 프로세스개선에 힘써야 함을 알 수 있었다.
전체 리뷰에 대한 네트워크 그래프에서는 ‘배송’이 네트워크의 중심이 되어 다른 단어와 연결됨에 따라, 제품이 고객에게 전달되는 과정 또한 중요한 전자상거래의 특성을 잘 보여주고 있다. 중립/부정 리뷰의 워드트리를 통해 고객이 불만족하고 있는 부분을 확인할 수 있었다.
S사와 K사 제품의 중립과 부정적 리뷰의 TF 분석은 [Table 3]과 같았다. 중립/부정적 리뷰에 대한 단어 빈도와 TF-IDF 분석에서는 전체 리뷰에서의 결과에 비해 보다 많은 상품적 특성이 발견되는 것을 확인할 수 있었다. 특히 ‘배터리’, ‘방수’, ‘통화’ ‘추적’ 등이 부정적 리뷰의 빈도수에서 상위권에 위치한 것을 통해, 소비자들은 해당 부문에서 제품에 대해 불만족을 느낀 것을 알 수 있다.
후속연구
하지만 키즈워치는 사용연령 7~8세의 경우 구매의사결정이 부모를 통해 이루어지고, 이 연령대의 아이들의 리뷰가 인터넷상에 거의 존재하지 않는다. 때문에 향후 연구에서는 이 연령대의 아이들의 전반적인 생활방식과 취향 관심사 등의 분석을 위해 아이들이 많이 시청하는 유투브 사이트 등 일반적인 SNS 외 추가적인 데이터수집방법 필요할 것이다.
현재는 분석으로 나온 단어들을 연구자가 임의로 가치사슬 내의 활동에 지정하여 개선점을 제언하였지만 이 과정을 딥러닝의 텍스트분류, Summarization 기법으로 정기적으로 해당 가치사슬 내 활동 부서에 전달한다면, 제품의 분석, 소비자 의견 분석, 그리고 더 나아가 서비스의 프로세스에 대한 개선이 효율적으로 처리가 가능할 것이다. 또한 Topic Modeling의 정확도가 올라가고, 개체명 인식을 통한 클러스터링의 기준을 가치사슬 내 활동으로 지정하여 자동 군집화가 가능할 것이다.
또한, 키즈폰의 경우, 타겟층이 자녀를 가진 부모로 한정되어 있으며, 제품 출시도 비교적 오래 되지 않아서 제품에 대한 리뷰가 예상보다 적은 한계가 있었다. 이는 지속적인 조사 및 분석을 통해 만족도를 개선하는 추가연구가 필요할 것이다.
분석을 통해 나온 핵심 키워드들을 자동으로 분류해주는 알고리즘과 사전의 구축의 필요성이 확인되었다. 현재는 분석으로 나온 단어들을 연구자가 임의로 가치사슬 내의 활동에 지정하여 개선점을 제언하였지만 이 과정을 딥러닝의 텍스트분류, Summarization 기법으로 정기적으로 해당 가치사슬 내 활동 부서에 전달한다면, 제품의 분석, 소비자 의견 분석, 그리고 더 나아가 서비스의 프로세스에 대한 개선이 효율적으로 처리가 가능할 것이다. 또한 Topic Modeling의 정확도가 올라가고, 개체명 인식을 통한 클러스터링의 기준을 가치사슬 내 활동으로 지정하여 자동 군집화가 가능할 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
키즈폰의 한계점은?
이 가운데 키즈폰은 불필요한 기능은 없애고 아동들에게 기본 안전 기능을 담은 웨어러블 디바이스로서 부모가 쉽게 자녀의 위치를 실시간으로 알게 해주는 유용한 도구이다. 키즈폰은 스마트폰에 비해 저렴하고 간편하지만 고장이 잦고, 안전 이외에 유용한 기능을 기대하기 힘들며, 부가적인 기능들 또한 유용하지 못하다는 점이 지적되고 있다. 본 연구는 국내 이동통신사의 키즈폰(Kids Phone)에 대한 리뷰를 분석하여, 제품들의 특성과 장단점을 파악하고, 디바이스와 서비스에 대한 개선방안을 제안함으로써, SNS 소비자 분석을 통한 제품 서비스 개선 전략수립 방법을 제시하고자 한다.
키즈폰의 유용한 측면은?
한편, 급속한 정보통신기술의 발달과 함께 이동통신사들이 아동을 위한 디지털상품을 출시하고 있는데, 특히 유해한 콘텐츠로부터 아동을 보호하고, 부모와 아동들에게 필요한 정보와 기능은 보완된 디지털 디바이스들이 등장하고 있다. 이 가운데 키즈폰은 불필요한 기능은 없애고 아동들에게 기본 안전 기능을 담은 웨어러블 디바이스로서 부모가 쉽게 자녀의 위치를 실시간으로 알게 해주는 유용한 도구이다. 키즈폰은 스마트폰에 비해 저렴하고 간편하지만 고장이 잦고, 안전 이외에 유용한 기능을 기대하기 힘들며, 부가적인 기능들 또한 유용하지 못하다는 점이 지적되고 있다.
기업의 마케팅리서치 방법 중 최근 주목받고 있는 방법은?
기업은 소비자가 만족하는 제품을 개발하고 개선하기 위하여 설문조사와 같은 전통적인 마케팅리서치 방법을 이용하여, 소비자의 의견을 듣고, 분석하여 반영하는 노력을 한다. 최근에는 인터넷 사이트, 사회관계망(SNS) 등 소비자 커뮤니케이션 플랫폼에서 관련 자료를 수집하고 분석하는 방법이 주목을 받고 있다. 한편, 급속한 정보통신기술의 발달과 함께 이동통신사들이 아동을 위한 디지털상품을 출시하고 있는데, 특히 유해한 콘텐츠로부터 아동을 보호하고, 부모와 아동들에게 필요한 정보와 기능은 보완된 디지털 디바이스들이 등장하고 있다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.