$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

영화 리뷰 감성분석을 위한 텍스트 마이닝 기반 감성 분류기 구축
A Study on Analyzing Sentiments on Movie Reviews by Multi-Level Sentiment Classifier 원문보기

지능정보연구 = Journal of intelligence and information systems, v.22 no.3, 2016년, pp.71 - 89  

김유영 (연세대학교 문헌정보학과) ,  송민 (연세대학교 문헌정보학과)

초록
AI-Helper 아이콘AI-Helper

누구나 본인이 사용한 제품이나, 이용한 서비스에 대한 후기를 자유롭게 인터넷에 작성할 수 있고, 이러한 데이터의 양은 점점 더 많아지고 있다. 감성분석은 사용자가 생성한 온라인 텍스트 속에 내포된 감성 및 감정을 식별하기 위해 사용된다. 본 연구는 다양한 데이터 도메인 중 영화 리뷰를 분석 대상으로 한다. 영화 리뷰를 이용한 기존 연구에서는 종종 리뷰 평점을 관객의 감성으로 동일시하여 감성분석에 이용한다. 그러나 리뷰 내용과 평점의 실제적 극성 정도가 항상 일치하는 것은 아니기 때문에 연구의 정확성에 한계가 발생할 수 있다. 이에 본 연구에서는 기계학습 기반의 감성 분류기를 구축하고, 이를 통해 리뷰의 감성점수를 산출하여 리뷰에서 나타나는 감성의 수치화를 목표로 한다. 나아가 산출된 감성점수를 이용하여 리뷰와 영화 흥행 간의 연관성을 살펴보았다. 감성분석 모델은 지지벡터 분류기와 신경망을 이용해 구축되었고, 총 1만 건의 영화 리뷰를 학습용 데이터로 하였다. 감성분석은 총 175편의 영화에 대한 1,258,538개의 리뷰에 적용하였다. 리뷰의 평점과 흥행, 그리고 감성점수와 흥행과의 연관성은 상관분석을 통해 살펴보았고, t-검정으로 두 지표의 평균차를 비교하여 감성점수의 활용성을 검증하였다. 연구 결과, 본 연구에서 제시하는 모델 구축 방법은 나이브 베이즈 분류기로 구축한 모델보다 높은 정확성을 보였다. 상관분석 결과로는, 영화의 주간 평균 평점과 관객 수 간의 유의미한 양의 상관관계가 나타났고, 감성점수와 관객 수 간의 상관분석에서도 유사한 결과가 도출되었다. 이에 두 지표간의 평균을 이용한 t-검정을 수행하고, 이를 바탕으로 산출한 감성점수를 리뷰 평점의 역할을 할 수 있는 지표로써 활용 가능함을 검증하였다. 나아가 검증된 결론을 근거로, 트위터에서 영화를 언급한 트윗을 수집하여 감성분석을 적용한 결과를 살펴봄으로써 감성분석 모델의 활용 방안을 모색하였다. 전체적 실험 및 검증의 과정을 통해 본 연구는 감성분석 연구에 있어 개선된 감성 분류 방법을 제시할 수 있음을 보였고, 이러한 점에서 연구의 의의가 있다.

Abstract AI-Helper 아이콘AI-Helper

Sentiment analysis is used for identifying emotions or sentiments embedded in the user generated data such as customer reviews from blogs, social network services, and so on. Various research fields such as computer science and business management can take advantage of this feature to analyze custom...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이때 감성은 하나의 리뷰가 내포하는 긍정 또는 부정적 성향을 감성점수(sentiment score)로써 표현한다. 그리고 감성분석의 결과로 도출된 감성점수와 관객의 직접적 평가인 리뷰 평점이 모두 영화의 흥행으로 대변되는 관객 수와 연관성을 보이는지에 대한 통계적분석을 수행함으로써 영화의 흥행과 리뷰에서 나타나는 감성에 대한 상관관계를 보고자 한다. 마지막으로, 이를 바탕으로 향후 영화 리뷰 감성분석의 활용을 모색해 보았다.
  • 1만 건의 리뷰를 이용함으로써 평점만을 관객의 감성으로 판단하여 사용했을 때 발생하는 선행연구들이 가지는 한계를 극복하고자 하였고, 리뷰의 평점과 모델을 이용하여 산출된 감성점수가 각각 영화의 흥행과 어떠한 관계가 있는지를 상관분석으로 살펴보았다. 나아가, 리뷰 평점과 감성점수의 평균 차이 비교를 통해 다른 텍스트 데이터로의 감성분석 방법 적용 가능성에 대해 살펴보았다.
  • , 2011; 김상호, 한진만, 2014)을 바탕으로 영화 리뷰의 평점과 흥행의 상관관계에 대한 재검증을 하고자 한다. 또한, 지도학습 기반의 영화 리뷰 감성분석으로 영화 리뷰에서 드러나는 감성과 흥행의 연관성에 대해 알아보려한다.
  • 그리고 감성분석의 결과로 도출된 감성점수와 관객의 직접적 평가인 리뷰 평점이 모두 영화의 흥행으로 대변되는 관객 수와 연관성을 보이는지에 대한 통계적분석을 수행함으로써 영화의 흥행과 리뷰에서 나타나는 감성에 대한 상관관계를 보고자 한다. 마지막으로, 이를 바탕으로 향후 영화 리뷰 감성분석의 활용을 모색해 보았다. 이러한 전체적인 연구 과정을 통해 지도학습을 기반으로 하는 문헌 분류기를 복합적으로 이용하여 감성분석의 성능을 향상 시킬 수 있는 방법론을 제안하고, 활용성을 밝히는 것이 본 연구의 목표이다.
  • 본 연구는 이와 같이 온라인 영화 리뷰를 이용한 감성분석 연구가 부족하고, 평점의 흥행에 대한 영향력 역시 지속적 검증이 필요하다는 점(박승현 외., 2011; 김상호, 한진만, 2014)을 바탕으로 영화 리뷰의 평점과 흥행의 상관관계에 대한 재검증을 하고자 한다. 또한, 지도학습 기반의 영화 리뷰 감성분석으로 영화 리뷰에서 드러나는 감성과 흥행의 연관성에 대해 알아보려한다.
  • 본 연구는 텍스트 마이닝 기반의 감성분석 모델을 구축하고, 이를 이용한 리뷰 내용의 감성분석을 목표로 하였다. 1만 건의 리뷰를 이용함으로써 평점만을 관객의 감성으로 판단하여 사용했을 때 발생하는 선행연구들이 가지는 한계를 극복하고자 하였고, 리뷰의 평점과 모델을 이용하여 산출된 감성점수가 각각 영화의 흥행과 어떠한 관계가 있는지를 상관분석으로 살펴보았다.
  • 그러나 지금은 감성분석 연구에서 활용되는 데이터의 특성상 경영 관리 분야에서도 주목하는 연구 분야이다. 본 절에서는 이러한 점을 고려하여, 감성분석 연구에서 영화 리뷰 데이터를 이용할 때 두 학문적 분야에서는 주로 어떠한 연구를 하는가에 대해 살펴보았다.
  • 컴퓨터 과학 분야에서 감성분석 모델 개발 및 평점 추론 등을 중점적으로 연구한다면, 경영 분야에서는 리뷰의 감성을 이용하는 어플리케이션 측면으로 연구가 확장된다. 영화의 상업적 측면에서 이러한 영화 리뷰의 감성 분석을 수익 예측에 활용하는 것이다. Dellarocas et al.
  • 마지막으로, 이를 바탕으로 향후 영화 리뷰 감성분석의 활용을 모색해 보았다. 이러한 전체적인 연구 과정을 통해 지도학습을 기반으로 하는 문헌 분류기를 복합적으로 이용하여 감성분석의 성능을 향상 시킬 수 있는 방법론을 제안하고, 활용성을 밝히는 것이 본 연구의 목표이다. 이를 통해 향후 제품 또는 서비스 리뷰와 같은 다른 도메인의 데이터에도 이와 같은 방법론을 적용하여 감성분석을 시도할 수 있다는 점에서 본 연구의 의의가 있다.
  • 이러한 전체적인 연구 과정을 통해 지도학습을 기반으로 하는 문헌 분류기를 복합적으로 이용하여 감성분석의 성능을 향상 시킬 수 있는 방법론을 제안하고, 활용성을 밝히는 것이 본 연구의 목표이다. 이를 통해 향후 제품 또는 서비스 리뷰와 같은 다른 도메인의 데이터에도 이와 같은 방법론을 적용하여 감성분석을 시도할 수 있다는 점에서 본 연구의 의의가 있다.
  • 이에 본 연구는 영화 리뷰를 대상으로 텍스트 마이닝을 이용한 감성분석을 시도하였다. 특히, 기계학습의 한 방법인 지도학습(supervised learning)을 이용한 감성 분류기를 구축하여 리뷰의 감성을 파악하였다.
  • 오피니언 마이닝 혹은 감성분석은 텍스트 마이닝 기법중 하나로, 어떠한 사용자가 생성한 온라인 텍스트 속에 담긴 감성(sentiment), 정서(affect), 주관(subjectivity), 또는 감정(emotion)을 식별하기 위해 사용된다(Chen and Zimbra, 2010). 즉, 감성분석을 통해 이용자가 제품 또는 서비스로부터 어떠한 느낌을 받았는지 파악하기 위한 것이다. 감성분석 연구의 관련 기법은 2000년대 이후로 활발히 연구되고 있는데, 특히 이러한 감성분석 연구가 급증한 주된 이유는 소셜 미디어의 확산에 있다(Liu 2012; Appel et al.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
단어 리스트란 무엇을 의미하는가? 다음 과정은 사전과 어휘 리스트 구축이다. 이 과정에서 구축되는 사전은 말뭉치(bag of words)와 같이 단어가 단순히 나열된 것이고, 단어 리스트는 단어의 출현 횟수를 기반으로 내림차순으로 정렬되어있는 것을 의미한다. 전처리를 통해 품사 태깅을 거친 텍스트는 긍정 형용사(positive adj.
영화 리뷰가 의견 분석이 가능한 데이터인 이유는 무엇인가? 영화 리뷰는 감성분석 연구에서 자주 활용되는, 특정 대상(각 영화)에 대한 의견 분석이 가능한 데이터이다. 왜냐하면 리뷰는 영화를 먼저 본 사람들의 평가로써 아직 영화를 보지 않은 사람들에게 큰 영향을 미칠 수 있기 때문이다(Neelamegham and Chintagunta, 1999). 또한 영화 리뷰 데이터는 이용자가 직접 리뷰와 함께 평점(star rating)을 남길 수 있다는 특징이 있다.
오피니언 마이닝 혹은 감성분석은 무엇을 위해 사용되는가? 누구나 제품 및 서비스를 이용하고 그 평가를 인터넷에 자유롭게 남길 수 있으며, 회사 및 조직은 이러한 고객의 리뷰, 즉 피드백을 이용하여 이익을 창출하기 위해 리뷰 데이터를 다방면으로 분석하는 시대이다. 오피니언 마이닝 혹은 감성분석은 텍스트 마이닝 기법중 하나로, 어떠한 사용자가 생성한 온라인 텍스트 속에 담긴 감성(sentiment), 정서(affect), 주관(subjectivity), 또는 감정(emotion)을 식별하기 위해 사용된다(Chen and Zimbra, 2010). 즉, 감성분석을 통해 이용자가 제품 또는 서비스로부터 어떠한 느낌을 받았는지 파악하기 위한 것이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (42)

  1. Airoldi, E., X. Bai and R. Padman, "Markov blankets and meta-heuristics search: sentiment extraction from unstructured texts," Proceedings of International Workshop on Knowledge Discovery on the Web, (2004), 167-187. 

  2. Amplayo, R. K. and J. Occidental, "Multi-level classifier for the detection of insults in social media," Proceedings of 15th Philippine Computing Science Congress, (2015). 

  3. Annett, M. and G. Kondrak, "A comparison of sentiment analysis techniques: Polarizing movie blogs," Advances in Artificial Intelligence, (2008), 25-35. 

  4. Appel, O., F. Chiclana and J. Carter, "Main concepts, state of the art and future research questions in sentiment analysis," Acta Polytechnica Hungarica, Vol.12, No.3(2015), 87-108. 

  5. Asur, S. and B. A. Huberman, "Predicting the future with social media. In Web Intelligence and Intelligent Agent Technology (WI-IAT)," Proceedings of 2010 IEEE/WIC/ACM International Conference, (2010), 492-299. 

  6. Chen, Y. and J. Xie, 'Online consumer review: Word-of-mouth as a new element of marketing communication mix," Management Science, Vol.54, No.3(2008), 477-491. 

  7. Chen, H. and D. Zimbra, "AI and opinion mining," IEEE Intelligent Systems, Vol.25, No.3(2010), 74-80. 

  8. Chevalier, J. A. and D. Mayzlin, "The effect of word of mouth on sales: Online book reviews," Journal of Marketing Research, Vol.43, No.3(2006), 345-354. 

  9. Cui, G., H. K. Lui and X. Guo, "The effect of online consumer reviews on new product sales," International Journal of Electronic Commerce, Vol.17, No.1(2012), 39-58. 

  10. Dellarocas, C., N. Awad and M. Zhang, "Using online ratings as a proxy of word-of-mouth in motion picture revenue forecasting," Smith School of Business, University of Maryland, 2005. 

  11. Duan, W. and A. B. Whinston, "The dynamics of online word-of-mouth and product sales-An empirical investigation of the movie industry," Journal of Retailing, Vol.84, No.2(2008), 233-242. 

  12. Ferguson, P., N. O'Hare, M. Davy, A. Bermingham, P. Sheridan, C. Gurrin and A. F. Smeaton, "Exploring the use of paragraph-level annotations for sentiment analysis of financial blogs," Proceedings of WOMAS 2009-Workshop on Opinion Mining and Sentiment Analysis, (2009). 

  13. Ghose, Al, and P. G. Ipeirotis, "Estimating the helpfulness and economic impact of product reviews: Mining text and reviewer characteristics," Knowledge and Data Engineering, IEEE Transactions on, Vol.23, No.10(2011), 1498-1512. 

  14. Glorot, X., A. Bordes and Y. Bengio, "Domain adaptation for large-scale sentiment classification: A deep learning approach," Proceedings of the 28th International Conference on Machine Learning, (2011), 513-520. 

  15. Heo, M. H., P. S. Kang and S. Cho, "Predicting Box-office with Opinion mining reviews," Proceedings of the Korean Operations and Management Science Society Conference, (2013), 487-500. 

  16. Hu, Z., W. Ding and X. Zheng, "Review sentiment analysis based on deep learning," Proceedings of e-Business Engineering (ICEBE) 2015 IEEE 12th International Conference, (2015), 87-94. 

  17. Jakob, N., S. H. Weber, M. C. Muller and I. Gurevych, "Beyond the stars: exploiting free-text user reviews to improve the accuracy of movie recommendations," Proceedings of the 1st international CIKM workshop on Topic-sentiment analysis for mass opinion, (2009), 57-64. 

  18. Jo, S. Y., H.-K. Kim, B. Kim and H.-W. Kim, "Predicting Movie Revenue by Online Review Mining : Using the Opening Week Online Review," Information Systems Review, Vol.16, No.3(2014), 113-134. 

  19. Jung, Y., Research in Information Retrieval, revised edition, Yonsei University Press, 2012. 

  20. Kennedy, A. and D. Inkpen, "Sentiment classification of movie reviews using contextual valence shifters," Computational intelligence, Vol.22, No.2(2006), 110-125. 

  21. Kim, M. H., S. E. Kim and Y. J. Choi, "The Determinants of Box-office Performance of Korean Films and Implications for Policies," Film Studies, No.46(2010), 31-56. 

  22. Kim, Y. H. and J. H. Hong, "A Study for the Development of Motion Picture Box-office Prediction Model," Communications for Statistical Applications and Methods, Vol.18, No.6(2011), 859-869. 

  23. Kim, S. H. and J. M. Han, "An Analysis of Motion Picture Box Office Performance : Focusing on Korean Movies Released in 2012," Social Science Studies, Vol.53, No.1 (2014), 191-214. 

  24. Konig, A. C. and E. Brill, "Reducing the human overhead in text categorization," Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, (2006), 598-603. 

  25. Krauss, J., S. Nann, D. Simon, P. A. Gloor and K. Fischbach, "Predicting Movie Success and Academy Awards through Sentiment and Social Network Analysis," In ECIS, (2008), 2026-2037. 

  26. Lee, K. J. and W. J. Jang, "Predicting Financial Success of a Movie Using Bayesian Choice Model," Proceedings of the Korean Operations and Management Science Society Conference, (2006), 1428-1433. 

  27. Liu, B., "Sentiment analysis and opinion mining," Synthesis Lectures on Human Language Technologies, Vol.5, No.1(2012), 1-167. 

  28. Melville, P., W. Gryc and R. D. Lawrence, "Sentiment analysis of blogs by combining lexical knowledge with text classification," Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining, (2009), 1275-1284. 

  29. Mullen, T. and N. Collier, "Sentiment analysis using support vector machines with diverse information sources," Proceedings of Empirical Methods in Natural Language Processing, (2004), 412-418. 

  30. Neelamegham, R. and P. Chintagunta, "A Bayesian model to forecast new product performance in domestic and international markets," Marketing Science, Vol.18, No.2(1999), 115-136. 

  31. Oh, Y.-J. and S.-H. Chae, "Movie Rating Inference by Construction of Movie Sentiment Sentence using Movie comments and ratings," Journal of Internet Computing and Services, Vol.16, No.2(2015), 41-28. 

  32. Pagano, D. and W. Maalej, "User feedback in the appstore: An empirical study," Proceedings of Requirements Engineering Conference, 2013 21st IEEE International, (2013), 125-134. 

  33. Pak, A. and P. Paroubek, "Twitter as a corpus for sentiment analysis and opinion mining," Proceedings of the Seventh International Conference on Language Resources and Evaluation, (2010), 1320-1326. 

  34. Pang, B., L. Lee and S. Vaithyanathan, "Thumbs up?: sentiment classification using machine learning techniques," Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language Processing, (2002), 79-86. 

  35. Pang, B. and L. Lee, "Opinion mining and sentiment analysis," Foundations and Trends in Information Retrieval, Vol.2, No.1-2 (2008), 1-135. 

  36. Park, S. H. and H.-J. Song, "Word of Mouth and Box Office Performance: WOM's Impact on Weekly Box Office Revenues," Korean Journal of Journalism and Communication Studies, Vol.56, No.4(2012), 210-235. 

  37. Park, S. H., H.-J. Song and W.-K. Jung, "The Determinants of Motion Picture Box Office Performance : Evidence from Korean Movies Released in 2009-2010," Journal of Communication Science, Vol.11, No.4(2011), 231-258. 

  38. Sarvabhotla, K., P. Pingali and V. Varma, "Supervised learning approaches for rating customer reviews," Journal of Intelligent Systems, Vol.19, No.1(2010), 79-94. 

  39. Seroussi, Y., F. Bohnert and I. Zukerman, "Personalised rating prediction for new users using latent factor models," Proceedings of the 22nd ACM conference on Hypertext and hypermedia, (2011), 47-56. 

  40. Shin, J. and H. Kim, "A Robust Pattern-based Feature Extraction Method for Sentiment Categorization of Korean Customer Reviews," Journal of KIISE : Software and Applications, Vol.37, No.12(2010), 946-950. 

  41. Wyatt, J., "High concept, product differentiation, and the contemporary US film industry," Current Research in Film: Audiences, Economics and Law, Vol.5(1991), 86-105. 

  42. Yanagimoto, H., M. Shimada and A. Yoshimura, "Document similarity estimation for sentiment analysis using neural network". Proceedings of Computer and Information Science (ICIS), 2013 IEEE/ACIS 12th International Conference, (2013), 105-110. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로