$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 사용자 리뷰 분석을 통한 호텔 평가 항목별 누락 평점 예측 방법론
Predicting Missing Ratings of Each Evaluation Criteria for Hotel by Analyzing User Reviews 원문보기

한국IT서비스학회지 = Journal of Information Technology Services, v.16 no.4, 2017년, pp.161 - 176  

이동훈 (국민대학교 비즈니스IT전문대학원) ,  부현경 (국민대학교 비즈니스IT전문대학원) ,  김남규 (국민대학교 경영정보학부)

Abstract AI-Helper 아이콘AI-Helper

Recently, most of the users can easily get access to a variety of information sources about companies, products, and services through online channels. Therefore, the online user evaluations are becoming the most powerful tool to generate word of mouth. The user's evaluation is provided in two forms,...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 연구에서는 사용자가 의도적으로, 또는 사이트 정책에 의해 미기입한 세부 항목별 평점을 예측하여 기입함으로써, 높은 비율의 결측값을 무시한 채 단순 평균을 제시하는 현재 서비스 방식의 한계를 극복할 수 있는 방안을 제시하고자 한다. 구체적으로 본 연구에서는 사용자가 입력한 텍스트 리뷰를 분석하여, 그 내용에 따라 누락된 세부 항목의 평점을 예측하고자 한다. 예를 들어 [Figure 2]는 사용자가 텍스트 리뷰에서 ‘침대’와 ‘청결도’에 대해 많은 내용을 언급하고 있음에도 불구하고, ‘가격’, ‘객실’, ‘서비스’의 기준에 대해서만 평점을 부여하고 ‘침대’, ‘장소’, ‘청결도’에 대해서는 평점을 기입하지 않은 경우를 보이고 있다.
  • 따라서 본 연구에서는 사용자가 의도적으로, 또는 사이트 정책에 의해 미기입한 세부 항목별 평점을 예측하여 기입함으로써, 높은 비율의 결측값을 무시한 채 단순 평균을 제시하는 현재 서비스 방식의 한계를 극복할 수 있는 방안을 제시하고자 한다. 구체적으로 본 연구에서는 사용자가 입력한 텍스트 리뷰를 분석하여, 그 내용에 따라 누락된 세부 항목의 평점을 예측하고자 한다.
  • 7로 각 세부 항목별 평점이 크게 차이나는 경우도 비일비재하다. 따라서 본 연구에서는 전체 평점뿐 아니라 텍스트 리뷰로부터 추출한 세부 항목에 대한 사용자의 평가 정보를 함께 활용하여 미기입된 세부 항목의 평점을 예측하는 방법론을 제안하고자 한다.
  • 본 연구에서는 리뷰에 대한 토픽 모델링을 통해 리뷰의 내용을 구조화하고, 구조화된 리뷰와 전체 평점에 기반을 두어 누락된 세부 항목 평점을 예측하는 방법론을 제안하고자 한다([Figure 3] 참조)
  • 본 절에서는 리뷰 분석을 통한 누락 평점 예측 모델 생성의 실험 과정 및 결과를 소개한다. 비정형 데이터인 사용자 리뷰의 토픽 대응도를 도출하기 위하여 [Table 8(b)]의 리뷰 207,968건을 대상으로 총 25개의 토픽의 대응도를 도출하였다.
  • 본 절에서는 세부 항목별로 평점이 누락된 평가를 제외하여 유효 평가만을 추출하는 과정을 소개 한다. [Table 2]는 이 과정의 설명을 위한 결측값을 다수 포함한 평가 10건의 예이다.
  • 본 절에서는 수집된 호텔 평가 정보로부터 각 세부 항목별 유효 평가만을 추출하는 실험 과정 및 결과를 소개한다.
  • 본 절에서는 전체 사용자 평가로부터 각 세부 항목별 유효 평가만을 추출하는 과정을 소개한다. 호텔 평가 데이터는 호텔 ID, 평가 ID, 전체 평점, 세부 평점, 그리고 리뷰로 구성되어 있으며, 리뷰를 제외한 모든 구성 요소는 정형 데이터로 분류 된다.
  • 본 절에서는 제안한 방법론을 실제 데이터 분석에 적용하기 위한 실험 개요를 소개한다. 데이터 수집 및 분석을 위해 [Table 6]과 같은 시스템 환경을 구성하였다.
  • 본 절에서는 토픽 모델링을 통해 사용자 리뷰를 정형 데이터로 구조화하고, 이를 활용하여 누락된 세부 항목의 평점을 예측하는 모델을 생성하는 과정을 소개한다. 우선 사용자의 리뷰를 구조화하기 위해 전체 리뷰에 대한 토픽 모델링을 수행한다.
  • 본 연구는 학술적/실무적으로 다음과 같은 의의를 갖는다. 우선 학술적으로 본 연구는 정형 데이터와 비정형 데이터를 통합하여 예측 모델을 생성하는 방법론을 제안하였다. 최근 텍스트 분석에 대한 수요가 증가함과 동시에 텍스트 분석의 유용성 및 정확성에 대한 의구심도 커지고 있는 상황에서, 구조화된 텍스트와 기존의 정형 데이터를 동시에 활용하는 방식으로 다양한 분야에서 많은 후속 연구가 수행될 수 있을 것이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
정량적인 평점은 해당 상품에 대한 전체 평점뿐 아니라, 다양한 평가 기준에 따른 세부 평점으로 구성되는데 그 예시에는 어떤 것이 있는가? 또한 정량적인 평점은 해당 상품에 대한 전체 평점뿐 아니라, 다양한 평가 기준에 따른 세부 평점으로 구성된다. 예를 들어 가장 대표적인 호텔 평가 사이트인 TripAdvisor의 경우 각 호텔에 대해 사용자가 평가한 텍스트 리뷰와 전체 평점(Overall Rating) 뿐 아니라, ‘가격’, ‘서비스’, ‘청결도’, ‘객실’, ‘침대의 퀄리티’, ‘입지’의 6개 세부 항목에 각각에 대한 평점 정보를 제공한다.
대부분의 사이트에서 사용자의 평가는 어떤 형태로 제공되는가? 대부분의 사이트에서 사용자의 평가는 정량적인 평점과 리뷰 텍스트의 두 가지 형태로 제공된다. 또한 정량적인 평점은 해당 상품에 대한 전체 평점뿐 아니라, 다양한 평가 기준에 따른 세부 평점으로 구성된다.
정량적인 평점은 어떻게 구성되는가? 대부분의 사이트에서 사용자의 평가는 정량적인 평점과 리뷰 텍스트의 두 가지 형태로 제공된다. 또한 정량적인 평점은 해당 상품에 대한 전체 평점뿐 아니라, 다양한 평가 기준에 따른 세부 평점으로 구성된다. 예를 들어 가장 대표적인 호텔 평가 사이트인 TripAdvisor의 경우 각 호텔에 대해 사용자가 평가한 텍스트 리뷰와 전체 평점(Overall Rating) 뿐 아니라, ‘가격’, ‘서비스’, ‘청결도’, ‘객실’, ‘침대의 퀄리티’, ‘입지’의 6개 세부 항목에 각각에 대한 평점 정보를 제공한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (42)

  1. Augustine, A. and M. Pathak, "User Rating Prediction for Movies", University of Texas at Austin, 2007. 

  2. Aurelio G.M. and R. Minazzi, "Web Reviews Influence on Expectations and Purchasing Intentions of Hotel Potential Customers", International Journal of Hospitality Management, Vol.34, 2013, 99-107. doi : http://dx.doi.org/10.1016/j.ijhm.2013.02.012 (Downloaded August 30, 2017). 

  3. Bao, Z. and H. Xia, "Movie Rating Estimation and Recommendation", CS229 2012 Project, Stanford University, 2012. 

  4. Blei, D.M., "Probabilistic Topic Models", Communications of the ACM, Vol.55, No.4, 2012, 77-84. doi : 10.1145/2133806.2133826 (Downloaded August 30, 2017). 

  5. Blei, D.M. and J.D. Lafferty, "Dynamic Topic Models", ICML '06 Proceedings of the 23rd International Conference on Machine Learning, 2006, 113-120. 

  6. Blei, D.M., A.Y. Ng, and M.I. Jordan, "Latent Dirichlet Allocation", Journal of Machine Learning Research, Vol.3, 2003, 993-1022. 

  7. Casalo, L.V., C. Flavian, M. Guinaliu, and Y. Ekinci, "Do Online Hotel Rating Schemes Influence Booking Behaviors?", International Journal of Hospitality Management, Vol. 49, 2015, 28-36. 

  8. Cui, G., H.K. Lui, and X.N. Guo, "The Effect of Online Consumer Reviews on New Product Sales", International Journal of Electronic Commerce, Vol.17, No.1, 2012, 39-58. 

  9. Davis, A. and D. Khazanchi, "The Influence of Online Word of Mouth on Product Sales in Retail E-commerce : An Empirical Investigation", Proceedings of the 13th Annual Americas Conference on Information Systems, Vol.13, No.3, 2007, 2149-2157. 

  10. Duan, W.J., G. Gu, and A.B. Whinston, "Do Online Reviews Matter?-An Empirical Investigation of Panel Data", Decision Support Systems, Vol.45, No.4, 2008, 1007-1016. 

  11. Gauri, D.K., A. Bhatnagar, and R. Rao, "Role of Word of Mouth in Online Store Loyalty", Magazine Communications of the ACM, Vol. 51, No.3, 2008, 89-91. 

  12. Gayatree, G., N. Elhadad, and A. Marian, "Beyond the Stars : Improving Rating Predictions Using Review Text Content", Twelfth International Workshop on the Web and Databases, 2009. 

  13. Ghose, A. and G.I. Panagiotis, "Designing Ranking Systems for Consumer Reviews : The Impact of Review Subjectivity on Product Sales and Review Quality", Proceedings of the International Conference on Decision Support Systems, 2006. 

  14. Ghose, A. and G.I. Panagiotis, "Designing Novel Review Ranking Systems : Predicting the Usefulness and Impact of Reviews", Proceedings of the Ninth International Conference on Electronic Commerce, 2007, 303-310. 

  15. Gupta, N., G.D. Fabbrizio, and P. Haffner, "Capturing the Stars : Predicting Ratings for Service and Product Reviews", Proceedings of the NAACL HLT 2010 Workshop on Semantic Search, Los Angeles, California, 2010, 36-43. 

  16. Ha, H.S., H.J. Kim, S.W. Choi, and S.R. Yoon, "Comparing and Predicting Movie Rating Using Social Network Service", Proceedings of Korean Institute of Information Scientists and Engineers, 2014, 276-278. (하헌석, 김한주, 최성운, 윤성로, "소셜 네트워크 서비스를 활용한 영화 평점 비교 및 예측", 한국정보과학회 학술발표논문집, 2014, 276-278.) 

  17. Hofmann, T., "Probabilistic Latent Semantic Indexing", Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Berkeley, California, 1999, 50-57. doi : 10.1145/312624.312649 (Downloaded August 30, 2017). 

  18. Hu, N., N.S. Koh, and S.K. Reddy, "Ratings Lead You to the Product Reviews Help You Clinch It? The Mediating Role of Online Review Sentiments on Product Sales", Decision Support Systems, Vol.57, 2014, 42-53. 

  19. Kim, G.M., M.H. Ahn, and Y.H. Lee, "Prediction of Movies based on Naver DB Information and Filtering Malicious Rating Markers", Proceedings of Korean Institute of Industrial Engineers, 2013, 1651-1662. (김경민, 안무혁, 이윤호, "네이버 DB정보 기반 영화 평점 예측 및 악의적 평점 기록자 Filtering", 대한산업공학회 춘계공동학술대회논문집, 2013, 1651-1662.) 

  20. Landauer, T.K., P.W. Foltz, and D. Laham, "An Introduction to Latent Semantic Analysis", Discourse Processes, Vol.25, No.2-3, 1998, 259-284. doi : http://dx.doi.org/10.1080/01638539809545028 (Downloaded August 30, 2017). 

  21. Lee, J., D.H. Park, and I. Han, "The Effect of Online Negative Online Consumer Reviews on Product Attitude : An Information Processing View", Electronic Commerce Research, and Applications, Vol.7, No.3, 2008, 341-352. 

  22. Lee, S., T.R. Jeon, G.D. Baek, and S.S. Kim, "A Movie Rating Prediction System of User Propensity Analysis based on Collaborative Filtering, and Fuzzy System", Journal of Korean Institute of Intelligent Systems, Vol.19, No.2, 2009, 242-247. (이수진, 전태룡, 백경동, 김성신, "협업적 필터링 및 퍼지시스템 기반 사용자 성향분석에 의한 영화 평가 예측 시스템", 한국지능시스템학회논문지, 제19권, 제2호, 2009, 242-247.) 

  23. Li, F., N. Liu, H. Jin, K. Zhao, Q. Yang, and X. Zhu, "Incorporating Reviewer, and Product Information for Review Rating Prediction", 22nd International Joint Conferences on Artificial Intelligence, Vol.3, 2011, 1820-1825. 

  24. Liu, C. and N. Kim "Methodology for Improving the Reliability of the Rating System for Leisure Activity Information Sites : Focusing on a Movie Information Site", Journal of Tourism & Leisure Research, Vol.27, No.7, 2015, 187-200. (류 신, 김남규, "여가활동 정보 사이트의 평점 시스템 신뢰성 향상 방안", 관광레저연구, 제27권, 제7호, 2015, 187-200.) 

  25. Liu, C.L., W.H. Hsaio, C.H. Lee, G.C. Lu, and E. Jou, "Movie Rating and Review Summarization in Mobile Environment", IEEE Transactions on Systems, Man, and Cybernetics-Part C : Applications and Reviews, Vol.42 No.3, 2012, 397-407. 

  26. Marovic, M., M. Mihokovic, M. Miksa, S. Pribil, and A. Tus, "Automatic Movie Ratings Prediction Using Machine Learning", Proceedings of the 34th International Convention, 2011, 1640-1645. 

  27. Moghaddam, S. and E. Martin, "ILDA : Interdependent LDA Model for Learning Latent Aspects and Their Ratings from Online Product Reviews", Proceedings of the 34th International ACM SIGIR Conference on Research and Development in Information Retrieval, 2011, 665-674. 

  28. Mudambi, S.M. and D. Schuff, "What Makes a Helpful Online Review? A Study of Customer Reviews on Amazon.com", Journal MIS Quarterly Archive, Vol.34, No.1, 2010, 185-200. 

  29. Oh, B.H., J.H. Yang, and H.J. Lee, "A Hybrid Recommender System based on Collaborative Filtering with Selective Utilization of Content-based Predicted Ratings", Journal of KISS : Software and Applications, Vol.41, No.4, 2014, 289-294. (오병화, 양지훈, 이현진, "콘텐츠 기반 예측 평점을 선택적으로 활용하는 협력적 필터링 기반 복합추천 시스템", 정보과학회논문지 : 소프트웨어 및 응용, 제41권, 제4호, 2014, 289-294.) 

  30. Park, D.H., J. Lee, and I. Han, "The Effect of Online Consumer Reviews on Consumer Purchasing Intention : The Moderating Role of Involvement", International Journal of Electronic Commerce, Vol.11, No.4, 2007, 125-148. 

  31. Patrali, C., "Online Reviews: Do Consumers Use Them?", Advances in Consumer Research, Vol.28, No.1, 2001, 129-133. 

  32. Persson, K., "Predicting Movie Ratings : a Comparative Study on Random Forests and Support Vector Machines", Dissertation, 2015. 

  33. Seo, S.Y., J. Huangy, H. Yangy, and Y. Liu, "Representation Learning of Users, and Items for Review Rating Prediction Using Attention- based Convolutional Neural Network", 3rd International Workshop on Machine Learning Methods for Recommender Systems, Houston, Texas, 2017. 

  34. Sharma, R.D., S. Tripathi, S.K. Sahu, S. Mittal, and A. Anand, "Predicting Online Doctor Ratings from User Reviews Using Convolutional Neural Networks", International Journal of Machine Learning, and Computing, Vol.6, No.2, 2016, 149-154. doi : 10.18178/ijmlc.2016.6.2.590 (Downloaded August 30, 2017). 

  35. Son, S.B. and J.H. Chun, "Product Feature Extraction and Rating Distribution Using User Reviews", Journal of Society for e-Business Studies, Vol.22, No.1, 2017, 65-87. (손수빈, 전종훈, "사용자 리뷰를 이용한 상품 특징 추출 및 평점 분배", 한국전자거래학회지, 제22권, 제1호, 2017, 65-87.) 

  36. Song, C.H., B.C. Kim, and K.D. Park, "Impact of Consumer Rating on Mobile Application Sales : A Comparison between Korean, and American Consumers", Korean Management Review, Vol.43, No.5, 2014, 1493-1518. (송치훈, 김병조, 박경도, "소비자 평점이 모바일 애플리케이션 구매에 미치는 영향-한국과 미국 소비자와의 비교를 중심으로", 경영학연구, 제43권, 제5호, 2014, 1493-1518.) 

  37. Tang, D., B. Qiny, T. Liuy, and Y. Yang, "User Modeling with Neural Network for Review Rating Prediction", Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence, 2015. 

  38. Wang, B., Y. Huang, and X. Li, "Combining Review Text Content, and Reviewer-Item Rating Matrix to Predict Review Rating", Computational Intelligence, and Neuroscience, 2016. doi : 10.1155/2016/5968705 (Downloaded August 29, 2017). 

  39. Wang, H., Y. Lu, and C.X. Zhai, "Latent Aspect Rating Analysis without Aspect Keyword Supervision", Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery, and Data Mining (KDD'11), 2011, 618-626. 

  40. Ye, Q., R. Law, and B. Gu, "The Impact of Online User Reviews on Hotel Room Sales", International Journal of Hospitality Management, Vol.28, No.1, 2009, 180-182. doi : http://dx.doi.org/10.1016/j.ijhm.2015.05.005 (Downloaded August 30, 2017). 

  41. Yew, J.L. and W.T. Yee, "Variational Bayesian Approach to Movie Rating Prediction", Association for Computing Machinery, 2007. 

  42. Yoon, D.M. and K.J. Kim, "Prediction of Rating Score from Short Comments on Movies Using Word-Rating Correlation Analysis", Proceedings of the HCI KOREA, 2011, 484-486. (윤두밈, 김경중, "단어-평점 상관관계 분석을 통한 단문 영화평 평점 예측", 한국HCI학회 학술대회, 2011, 484-486.) 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로