온라인 마켓에 수많은 상품정보가 공개됨에 따라, 소비자들은 장소나 시간에 구애 받지 않고 자신이 원하는 상품을 구매할 수 있게 되었다. 하지만, 온라인 마켓의 경우 소비자들이 직접 상품을 살펴볼 수 없기 때문에, 다른 사람의 상품리뷰가 구매 의사결정에 많은 영향을 미친다. 한편, 많은 수의 리뷰를 모두 살펴보는 것은 구매자에게 부담으로 느껴진다. 이에 따라 많은 양의 상품리뷰를 분석하여 소비자에게 정제된 정보를 제공할 필요성이 제기되고 있다. 본 논문에서는 자연어처리 및 통계적 분석을 활용하여 상품의 특징을 추출하고, 각 특징별 평가점수를 소비자에게 제공하여 상품의 장단점을 보다 쉽고 정확하게 알 수 있도록 하는 상품평가 시스템의 설계 및 구현에 대하여 다루었다. 상품특징별 평가를 소비자에게 제공함으로써, 소비자는 자신의 취향에 맞는 상품을 선택할 수 있는 기회를 얻을 수 있으며, 기업은 소비자의 상품에 대한 선호정보를 보다 구체적으로 파악할 수 있을 것으로 기대된다.
온라인 마켓에 수많은 상품정보가 공개됨에 따라, 소비자들은 장소나 시간에 구애 받지 않고 자신이 원하는 상품을 구매할 수 있게 되었다. 하지만, 온라인 마켓의 경우 소비자들이 직접 상품을 살펴볼 수 없기 때문에, 다른 사람의 상품리뷰가 구매 의사결정에 많은 영향을 미친다. 한편, 많은 수의 리뷰를 모두 살펴보는 것은 구매자에게 부담으로 느껴진다. 이에 따라 많은 양의 상품리뷰를 분석하여 소비자에게 정제된 정보를 제공할 필요성이 제기되고 있다. 본 논문에서는 자연어처리 및 통계적 분석을 활용하여 상품의 특징을 추출하고, 각 특징별 평가점수를 소비자에게 제공하여 상품의 장단점을 보다 쉽고 정확하게 알 수 있도록 하는 상품평가 시스템의 설계 및 구현에 대하여 다루었다. 상품특징별 평가를 소비자에게 제공함으로써, 소비자는 자신의 취향에 맞는 상품을 선택할 수 있는 기회를 얻을 수 있으며, 기업은 소비자의 상품에 대한 선호정보를 보다 구체적으로 파악할 수 있을 것으로 기대된다.
As a number of product information is increasing in online markets, customers can purchase products with no spatial and time problems. However, in case of an online market, since customers can't see products directly, others' reviews make a big influence to customers. Meanwhile, it is a burden to re...
As a number of product information is increasing in online markets, customers can purchase products with no spatial and time problems. However, in case of an online market, since customers can't see products directly, others' reviews make a big influence to customers. Meanwhile, it is a burden to read all reviews about some products. Therefore, we need to provide refined information to customers as summarizing whole product reviews. In this paper, we explain about the product review summarization system which can provide to customers as show evaluation scores of product features. Natural Language Processing skills and computational statistics are utilized for summarization. Customers can get chances to buy a feasible product that he wants to get through this system. Moreover, Enterprises can find out the needs of customers deeply.
As a number of product information is increasing in online markets, customers can purchase products with no spatial and time problems. However, in case of an online market, since customers can't see products directly, others' reviews make a big influence to customers. Meanwhile, it is a burden to read all reviews about some products. Therefore, we need to provide refined information to customers as summarizing whole product reviews. In this paper, we explain about the product review summarization system which can provide to customers as show evaluation scores of product features. Natural Language Processing skills and computational statistics are utilized for summarization. Customers can get chances to buy a feasible product that he wants to get through this system. Moreover, Enterprises can find out the needs of customers deeply.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 상품리뷰에 나타난 사용자의 의견정보를 추출 및 분석하고, 상품특징별 점수화를 통해 상품에 대한 평가를 내리는 방법에 대하여 연구하고, 이러한 과정을 수행하는 상품리뷰요약시스템을 설계 및 구현한 내용을 다루었다.
본 논문에서는 상품특징별 점수화를 활용한 상품리뷰요약 시스템의 설계 및 구현에 대하여 다루었다. 이를 위해 각 단계별 프로세스를 설명하고, 그 역할을 수행하는 모듈의 구성 및 기능에 대하여 설명하였다.
본 연구에서는 상품리뷰요약을 수행할 때, 상품의 대표적인 특징별로 점수화하여 사용자에게 제공한다. 이것은 사용자들이 상품을 구매할 때 자신에게 필요한 적합한 특징을 고려하여 구매할 수 있도록 하기 위함이다.
제안 방법
첫 번째 시스템은 자연어처리기법에 기반한 것으로, 그림 1 의 (가)와 같이, 각 상품특징별로 리뷰 내에서 긍정적 또는 부정적 의미를 가진 어휘의 수를 계산하여 누적 정보를보여준다. 두번째 시스템은 사용자의 평가점수를 활용한 것으로써, 각 상품특징 어휘의 출현빈도와 상품에 대한 평가점수를 활용하여 상품특징별로 점수화하여 (나)와 같이 사용자에게 제공한다. 마지막 형태의 시스템은 상품특징을 나타내는 어휘들의 출현빈도 정보를 활용하여, 특징별 중요성을 트리맵의 형태로 사용자에게 제공하는 것으로, (다)와 같은 형태를 보인다.
그러나, 리뷰에 부여된 평가점수는 종합적인 의미를 나타낸다. 따라서, 특정 상품특징에 대한 평가점수를 계산하기 위해서 본 연구에서는 상품특징의 의미정보와 리뷰의 평가점수를 활용하여 새로운 점수를 계산한다.
기존의 시스템 및 방법들과 비교했을 때, 전문가의 큰 노력이 필요 없이 다양한 알고리즘을 쉽게 적용해 볼 수 있으며, 사전구축의 자동화를 통해 유연성을 높였다. 또한 리뷰의 평가점수를 그대로 보여주는 것이 아닌, 상품특징별 평가점수를 계산하여 사용자에게 제공함으로써 좀 더 정확한 리뷰 요약을 수행하였다. 따라서, 제시된 시스템을 통하여 대용량의 상품리뷰를 사용자에게 효율적으로 요약하여 보여줄 수 있게 되었다.
오피니언마이닝 기술로 가장 많이 연구되어진 방법이 자연어처리기법이다. 리뷰문서의 내용을 파악하기 위해서 POS 태그를 활용하여 문서의 문장들을 문장성분 단위로 파싱한 뒤, 문장성분들 사이의 관계 및 문장성분의 패턴정보 등을 활용하여 리뷰에서 사용자가 말하고자 하는 내용을 파악한다. 이 때, 가장 큰 역할을 수행하며 의미판단의 기초가 되는 것으로써 워드넷이 활용된다.
통계적 방법은 자연어처리기법이 전문가의 손이 많이 필요하며, 많은 시간을 소비한다는 단점을 해결하기 위한 대체방안으로 주목되었다. 문서 내의 어휘의 출현빈도 및 TF/IDF, PMI 등의 방법을 이용하여 리뷰문서 내의 중요한 상품특징 및 의견을 나타내는 어휘를 추출하고, 그 의미를 판단하였다. 특히, 최근에는 사용자가 리뷰와 함께 상품에 대해 평가정도를 나타낸 점수(별점)정보를 활용하여, 사용자의 의견을 파악하는데 활용한 연구가 이루어졌다.
본 논문에서는 상품특징별 점수화를 활용한 상품리뷰요약 시스템의 설계 및 구현에 대하여 다루었다. 이를 위해 각 단계별 프로세스를 설명하고, 그 역할을 수행하는 모듈의 구성 및 기능에 대하여 설명하였다. 기존의 시스템 및 방법들과 비교했을 때, 전문가의 큰 노력이 필요 없이 다양한 알고리즘을 쉽게 적용해 볼 수 있으며, 사전구축의 자동화를 통해 유연성을 높였다.
의미분석 단계에서는 상품특징추출단계에서 뽑아진, <상품특징 어휘, 의미표현 어휘>의 쌍으로 이루어진 어휘들이 의미하는 것이 긍정적인지, 또는 부정적인지를 분석한다. 이를 위해서 기 구축된 의미사전을 활용하여 PMI값을 계산한 후, 의미적 성향을 판별한다.
성능/효과
또한 리뷰의 평가점수를 그대로 보여주는 것이 아닌, 상품특징별 평가점수를 계산하여 사용자에게 제공함으로써 좀 더 정확한 리뷰 요약을 수행하였다. 따라서, 제시된 시스템을 통하여 대용량의 상품리뷰를 사용자에게 효율적으로 요약하여 보여줄 수 있게 되었다.
후속연구
향후, 웹을 통한 상품리뷰요약 조회가 가능하도록 하고, 국내 온라인 상품리뷰 데이터를 대상으로 리뷰요약시스템을 개발할 예정이며, 국내 데이터의 특성에 맞는 의미사전 구축 및 상품특징별 점수화 방법에 대한 고도화 연구를 지속할 예정이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.