$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

텍스트 마이닝 기반의 온라인 상품 리뷰 추출을 통한 목적별 맞춤화 정보 도출 방법론 연구
A Study on the Method for Extracting the Purpose-Specific Customized Information from Online Product Reviews based on Text Mining 원문보기

한국전자거래학회지 = The Journal of Society for e-Business Studies, v.21 no.2, 2016년, pp.151 - 161  

김주영 (Dept. of Industrial and Information Systems Engineering, Soongsil University) ,  김동수 (Dept. of Industrial and Information Systems Engineering, Soongsil University)

초록
AI-Helper 아이콘AI-Helper

개방, 공유, 참여를 특징으로 하는 웹 2.0 시대로 들어서면서 인터넷 사용자들의 데이터 생산 및 공유가 쉬워졌다. 이에 따른 데이터의 기하급수적인 증가와 함께 디지털 정보의 대부분인 비정형적 데이터(Unstructured Data)의 양도 증가하고 있다. 인터넷에서 정해진 형식 없이 자연어 형태로 만들어진 비정형 데이터 중, 특정 상품들에 대해 개인이 평가한 리뷰들은 해당 기업이나 해당 상품에 관심이 있는 잠재적 고객에게 필요한 데이터이다. 많은 양의 리뷰 데이터에서 상품에 대한 유용한 정보를 얻기 위해서는 데이터 수집, 저장, 전처리, 분석, 및 결론 도출의 과정이 필요하다. 따라서 본 연구는 R을 이용한 텍스트 마이닝(Text Mining) 기법을 사용하여 텍스트 형식의 비정형 데이터에서 자연어 처리 기술 및 문서 처리 기술을 적용하여 정형화된 데이터 값을 도출하는 방법에 대해 소개한다. 또한, 도출된 정형화된 리뷰 정보를 데이터 마이닝 기법에 적용하여 목적에 맞게 맞춤화된 리뷰 정보를 도출시키는 방안을 제시하고자 한다.

Abstract AI-Helper 아이콘AI-Helper

In the era of the Web 2.0, characterized by the openness, sharing and participation, it is easy for internet users to produce and share the data. The amount of the unstructured data which occupies most of the digital world's data has increased exponentially. One of the kinds of the unstructured data...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 연구는 R 프로그램을 바탕으로 한 텍스트 마이닝을 이용하여 비정형적인 상품 리뷰 데이터를 자연어 처리 기술 및 문서 처리 기술을 적용하여 이를 정형화된 데이터로 정제하는 방법에 대해 설명한다. 그 후, 텍스트 마이닝을 통해 추출한 데이터로 이루어진 리뷰 데이터셋(Review Dataset)의 속성값(Attribute)들과 속성 값을 구성하는 요소(Element)들에 데이터 마이닝을 이용하여 목적에 맞춤화된 리뷰 정보를 도출시키는 방안에 대해 소개하고자 한다.
  • 해당 연구에서는 비정형적인 리뷰 데이터를 유용한 정보로 가공하는 방안을 제시하는 것에 초점을 두고 연구하였다. 따라서 본 연구는 R 프로그램을 바탕으로 한 텍스트 마이닝을 이용하여 비정형적인 상품 리뷰 데이터를 자연어 처리 기술 및 문서 처리 기술을 적용하여 이를 정형화된 데이터로 정제하는 방법에 대해 설명한다. 그 후, 텍스트 마이닝을 통해 추출한 데이터로 이루어진 리뷰 데이터셋(Review Dataset)의 속성값(Attribute)들과 속성 값을 구성하는 요소(Element)들에 데이터 마이닝을 이용하여 목적에 맞춤화된 리뷰 정보를 도출시키는 방안에 대해 소개하고자 한다.
  • 또한, 전체 데이터를 통한 일반적인 정보 외에도 기업이나 소비자가 목적에 해당하는 맞춤화된 정보만 볼 수 있게끔 데이터의 분류 및 군집화가 필요하다[18]. 따라서 본 연구는 목적에 맞춤화된 유용한 리뷰 정보를 도출하는 방안 및 특정 제약조건과 연관된 리뷰 정보를 제공하는 방안에 대해 제시하였다. 기업은 정제한 리뷰 정보를 통해 상품의 특성별 고객의 기호도를 파악할 수 있고, 고객의 경우, 자신의 정보와 비슷한 고객들이 남긴 리뷰를 정리하여 보여줌으로써 추천 리뷰 서비스로 확장이 가능할 것이다.
  • 본 연구에서는 온라인 쇼핑몰에서 판매되는 특정 상품에 대한 리뷰를 추출하고 정리하여 정형 데이터로 만드는 것을 목표로 한다. 연구의 흐름은 리뷰 데이터 수집 및 저장, 자연어 처리, 키워드 추출, 그리고 자료 분류 및 요약 순으로 진행된다.
  • 많은 양의 정형화된 데이터에서 정보를 추출하여 가공하는 데이터 마이닝은 이미 많은 분야에서 사용되고 있다[19]. 해당 연구에서는 비정형적인 리뷰 데이터를 유용한 정보로 가공하는 방안을 제시하는 것에 초점을 두고 연구하였다. 따라서 본 연구는 R 프로그램을 바탕으로 한 텍스트 마이닝을 이용하여 비정형적인 상품 리뷰 데이터를 자연어 처리 기술 및 문서 처리 기술을 적용하여 이를 정형화된 데이터로 정제하는 방법에 대해 설명한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
기업이나 불특정 개인이 필요로 하는 정보를 찾기 위해 온라인 상품 리뷰을 취합하고 가공하는 분석 기술을 요하는 이유는 무엇인가? 이는 텍스트 마이닝(Text Mining) 기법 사용 없이는 정해진 스키마가 없는 비정형 데이터에서 의미 있는 정보를 추출하기 어려움을 의미 한다. 또한, 사용자들의 수동적, 능동적인 참여에 따라 방대한 양의 리뷰들이 존재하기 때문에 기업이나 불특정 개인이 필요로 하는 가치 있는 정보를 찾기 위해서는 온라인 상품 리뷰들을 취합하고 가공하는 분석 기술을 요한다.
집단 지성이란 무엇인가? 이로 인해 해당 내용에 관심이 있는 개인에게는 새로운 정보를 얻을 수 있는 기회를, 기업에게는 자사 상품들에 대한 고객 들의 견해와 관련된 텍스트 데이터를 데이터베이스에 구축할 수 있는 방법 중 하나인 집단지성(Collective Intelligence)이 탄생하게 되었다. 집단 지성이란 많은 사람들로부터 산출된 데이터를 협력 혹은 경쟁을 적용하여 나온 결과물을 의미한다[20]. 이는 전문가 개인이 제공 하는 정보보다 다수의 데이터로 산출된 정보가 올바른 결론에 가깝다고 할 수 있다.
리뷰 데이터를 가치가 있는 정보로 가공하여 의미와 규칙 정보를 발견하는 것이 필요한 이유는 무엇인가? 하지만 많은 곳에 산재해 있는 온라인 리뷰 데이터는 그 자체만으로는 의미 있는 정보를 얻기 힘들다. 이로 인해 잠재적 고객은 단순히 가장 인기 있는 리뷰나 최근의 리뷰를 읽고 구매 여부를 결정한다[10]. 따라서 단순한 집단 지성으로 산출된 데이터의 나열이 아닌 리뷰 데이터를 가치가 있는 정보로 가공하여 의미와 규칙 정보를 발견하는 것이 필요하다[6].
질의응답 정보가 도움이 되었나요?

참고문헌 (20)

  1. Archak, N., Ghose, A., and Ipeirotis, P. G., "Deriving the pricing power of product features by mining consumer reviews," Management Science, Vol. 57, No. 8, pp. 1485-1509, 2011. 

  2. Baars, H. and Kemper, H.-G., "Management support with structured and unstructured data-an integrated business intelligence framework," Information Systems Management, Vol. 25, No. 2, pp. 132-148, 2008. 

  3. Blumberg, R. and Atre, S., "The problem with unstructured data," DM Review Magazine, 2003. 

  4. Buneman, P., "Semistructured data," Proceedings of the sixteenth ACM SIGACTSIGMOD-SIGART symposium on Principles of database systems, ACM, 1997. 

  5. Chevalier, J. A. and Mayzlin, D., "The effect of word of mouth on sales: Online book reviews," Journal of marketing research, Vol. 43, No. 3, pp. 345-354, 2006. 

  6. Collins, M., Head-driven statistical models for natural language parsing, Computational linguistics, Vol. 29, No. 4, pp. 589-637, 2003. 

  7. Decker, R. and Trusov, M., "Estimating aggregate consumer preferences from online product reviews," International Journal of Research in Marketing, Vol. 27, No. 4, pp. 293-307, 2010. 

  8. Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P., "From data mining to knowledge discovery in databases," AI magazine, Vol. 17, No. 3, pp. 37-54, 1996. 

  9. Holton, C., "Identifying disgruntled employee systems fraud risk through text mining: A simple solution for a multi-billion dollar problem," Decision Support Systems, Vol. 46, No. 4, pp. 853-864, 2009. 

  10. Kangale, A., Kumara, S. K., Naeema, M. A., Williamsb, M., and Tiwaria, M. K., "Mining consumer reviews to generate ratings of different product attributes while producing feature-based review-summary," International Journal of Systems Science, Vol. 47, No. 13, pp. 1-15, 2016. 

  11. Kozinets, R. V., de Valck, K., Wojnicki, A. C., and Wilner, S. J. S., "Networked narratives: Understanding word-of-mouth marketing in online communities," Journal of marketing, Vol. 74, No. 2, pp. 71-89, 2010. 

  12. Lee, J., "How eWOM Reduces Uncertainties in Decision-making Process: Using the Concept of Entropy in Information Theory," The Journal of Society for e-Business, Vol. 16, No. 4, pp. 241-256, 2011. 

  13. Mangold, C., "A survey and classification of semantic search approaches," International Journal of Metadata, Semantics and Ontologies, Vol. 2, No. 1, pp. 23-34, 2007. 

  14. Mayer-Schonberger, V. and Cukier, K., Big data: A revolution that will transform how we live, work, and think., Houghton Mifflin Harcourt, 2013. 

  15. McAfee, A. and Brynjolfsson, E., "Big data," The management revolution, Harvard Bus Rev, Vol. 90, No. 10, pp. 61-67, 2012. 

  16. Mei, Q. and Zhai, C. X., "Discovering evolutionary theme patterns from text: an exploration of temporal text mining," Proceedings of the eleventh ACM SIGKDD international conference on Knowledge discovery in data mining, ACM, 2005. 

  17. O'reilly, T., "What is Web 2.0: Design patterns and business models for the next generation of software," Communications and strategies, No. 1, p. 17, 2007. 

  18. Tan, A.-H., "Text mining: The state of the art and the challenges," Proceedings of the PAKDD 1999 Workshop on Knowledge Discovery from Advanced Databases, pp. 65-70, 1999. 

  19. Washio, T. and H. Motoda., "State of the art of graph-based data mining," Acm Sigkdd Explorations Newsletter, Vol. 5, No. 1, pp. 59-68, 2003. 

  20. Woolley, A. W., Chabris, C. F., Pentland, A., Hashmi, N., and Malone, T. W., "Evidence for a collective intelligence factor in the performance of human groups," science, Vol. 330, No. 6004, pp. 686-688, 2010. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로