$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

영역별 맞춤형 감성사전 구축을 통한 영화리뷰 감성분석
Sentiment analysis on movie review through building modified sentiment dictionary by movie genre 원문보기

지능정보연구 = Journal of intelligence and information systems, v.22 no.2, 2016년, pp.97 - 113  

이상훈 (한양대학교 자연과학대학 수학과) ,  최정 (한양대학교 일반대학원 경영학과) ,  김종우 (한양대학교 경영대학 경영학부)

초록
AI-Helper 아이콘AI-Helper

인터넷상의 데이터가 급속하게 증가함에 따라 막대한 양의 데이터를 목적에 맞게 적절히 활용하는 빅데이터 분석이 활발하게 진행되고 있다. 최근에는 기존의 정형 데이터분석이 가진 한계점을 보완하는 방법으로 비정형 데이터 분석 분야 중 하나인 텍스트마이닝 기법에 대한 연구들이 다수 이루어지고 있으며, 특히 텍스트를 기반으로 문장의 긍정, 부정을 판별하고 분류하는 감성분석과 관련된 연구들이 활발하게 이루어지고 있다. 이러한 연구의 연장선 상에서, 본 연구는 감성분석에 사용되는 감성사전을 데이터의 특성에 맞게 적절하게 변형하여 구축하는 방법을 시도하였다. 데이터가 속한 영역의 특성을 고려하지 않은 기존의 범용 감성사전을 감성분석에 사용할 경우, 해당 영역에서 쓰이는 단어 또는 감정 표현을 반영하지 못하므로 감성분석의 정확성이 떨어질 수 있다. 따라서 감성분석에 있어서 영역 맞춤형 감성사전의 사용 시 데이터 영역의 특성을 정확하게 반영해 분석의 정확성을 높여줄 것으로 기대할 수 있다. 본 연구에서는 영화 리뷰 데이터를 분석 대상으로 선정하였으며, 대표적 영화정보 사이트 IMDb에서 발생된 약 2년간의 영화리뷰 데이터를 수집 분석하였다. 분석에 앞서 영화 장르별 사용되는 단어의 의미가 각각 다를 것을 고려하여 영화를 '액션', '애니메이션', '코메디', '드라마', '공포', '과학공상' 6개 장르로 분류했다. 맞춤형 감성사전 구축을 위한 핵심 기법으로 SO-PMI(Semantic Orientation from Point-wise Mutual Information)를 활용하였으며, 어휘 간 극성이 뚜렷하게 구분되는 형용사에 한정하여 연구를 진행했다. 분석결과 맞춤형사전을 활용한 감성분석 예측정확도는 영화 장르별로 상이했다. '애니메이션'을 제외한 5개 장르에서 기존의 범용 감성사전대비 맞춤형 감성사전의 예측정확도가 통계적으로 유의한 수준의 성능 향상을 보였다. 본 연구에서는 데이터 영역의 특성에 맞는 맞춤형 사전 구축을 통한 감성분석의 예측의 성능 향상을 확인하였다. 향후 감성사전 구축 시 동사, 부사 등 다양한 품사의 어휘를 추가하여 감성분석 예측정확도를 높이는 방안을 모색할 수 있을 것이다.

Abstract AI-Helper 아이콘AI-Helper

Due to the growth of internet data and the rapid development of internet technology, "big data" analysis is actively conducted to analyze enormous data for various purposes. Especially in recent years, a number of studies have been performed on the applications of text mining techniques in order to ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 본 연구는 감성분석의 예측능력을 향상시키기 위해 데이터 특성에 맞는 맞춤형 감성사전 구축 방법을 제시한다. 본 연구에서 장르에 따라서 감성 어휘들이 차이가 나는 영화 장르별 리뷰 데이터를 대상으로 하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
감성분석은 무엇에 기반을 두어 이루어지는가? 감성분석(sentiment analysis)은 텍스트마이닝 분석의 한 분야로 특정 문서의 긍정, 부정에 대한 감정을 추측하고 분류하는 방법이다. 감성분석은 각 문서의 최소단위인 단어의 감성극성(sentiment polarity)에 기반을 두어 이루어진다. 즉, 단어의 감성극성이 미리 정의된 감성사전을 구축한 후, 새로 주어진 문서에 출현한 단어의 감성극성에 따라 문서 전체의 감성을 분류하게 된다(Kim and Kim, 2014).
감성분석은 어떤 역할을 하고 있는가? 이에 따라, 소비자들의 평가를 마케팅 데이터로 활용하기 위해 감성분석을 활용한 상품평 분류에 관한 연구가 지속되고 있다. 감성분석은 기업에게 상품에 대한 피드백을 제공하여 상품 개발 또는 판매전략 수립에 정보를 제공하고 있으며 소비자에게는 상품선택에 대한 의사결정을 보조하고 있다(Chang, 2009).
기존에 사용되는 범용 감성사전을 서로 다른 분야의 감성분석에 적용하는 것이 효과적이지 못한 이유는? 예를 들어, 영화리뷰에서 사용가능한 ‘scary’의 경우 공포영화 장르에서는 긍정의 의미로 사용이 가능하지만 그 밖의 드라마, 애니메이션 등의 장르에서는 부정적인 단어로 사용된다. 이렇듯 분석 대상 영역의 특성에 따라 동일한 단어가 서로 다른 의미로 사용될 수 있기 때문에 데이터 영역의 특성에 따라 서로 다른 맞춤형 감성사전이 구축되어야 한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (20)

  1. Adhitama P., S. H. Kim and I. S. Na, "Twitter Trending Topic Classification using Naive Bayes Classifier," Proceedings of the Korean Information Science Society Conference, Vol.40(2013), 879-881. 

  2. An J. K. and H. W. Kim, "Building a Korean Sentiment Lexicon Using Collective Intelligence," Journal of Intelligent Information Systems, Vol.21, No.2(2015), 49-67. 

  3. Chang J. Y., "A Sentiment Analysis Algorithm for Automatic Product Reviews Classification in On-Line Shopping Mall," The Journal of Society for e-Business Studies, Vol.14, No.4(2009), 19-33. 

  4. Cho T. M., H. N. Cho, J. D. Lee and J. H. Lee, "TV Drama Rating Prediction based on Sentiment Analysis of Viewers' Comments," Proceedings of the Korean Institute of Intelligent Systems Conference, Vol.24, No.1 (2014), 83-84. 

  5. Jin W., H. H. Ho and R. K. Srihari, "OpinionMiner: A Novel Machine Learning System for Web Opinion Mining and Extraction," KDD Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining(2009), 1195-1204. 

  6. Jo, E. K., "The Current State of Affairs of the Sentiment Analysis and Case Study Based on Corpus," The Journal of Linguistic Science, Vol.61(2012), 259-282. 

  7. Jo H. J., J. H. Seo and J. T. Choi, "OAR Algorithm Technology Based on Opinion Mining Utilizing Stock News Contents," Journal of Korean Institute of Information Technology, Vol.13, No.2(2015), 111-119. 

  8. Kim J. H., Y. J. Oh and S. H. Chae, "The Construction of a Domain-Specific Sentiment Dictionary Using Graph-based Semi-supervised Learning Method," Korean Journal of the Science of Emotion and Sensibility, Vol.18, No.4(2015), 97-104. 

  9. Kim K. P. and Y. S. Kwon, "Performance Comparison of Naive Bayesian Learning and Centroid-Based Classification for e-Mail Classification," IE Interfaces Vol.18, No.1 (2005), 10-21. 

  10. Kim S. W. and N. G. Kim, "A Study on the Effect of Using Sentiment Lexicon in Opinion Classification," Journal of Intelligent Information Systems, Vol.20, No.1(2014), 133-148. 

  11. Lee K. B., J. B. Baik and S. W. Lee, "Estimating a Pleasure-Displeasure Index of Word based on Word Similarity in SNS," Journal of KIISE : Computing Practices and Letters, Vol.20, No.3(2014), 159-164. 

  12. Oh S. H. and S. J. Kang, "Movie Retrieval System by Analyzing Sentimental Keyword from User's Movie Reviews," Journal of the Korea Academia-Industrial cooperation Society, Vol.14, No.3(2013), 1422-1427. 

  13. Scaffidi C., K. Bierhoff, E. Chang, M. Felker, H. Ng, and C. Jin, "Red Opal: Product-Feature Scoring from Reviews," Proceedings of the 8th ACM conference on Electronic commerce(2007), 182-191. 

  14. Seo J. H., H. J. Jo and J. T. Choi, "Design for Opinion Dictionary of Emotion Applying Rules for Antonym of the Korean Grammar," Journal of Korean Institute of Information Technology, Vol.13, No.2(2015), 109-117. 

  15. Song J. S., and S. W. Lee, "Automatic Construction of Positive/Negative Feature-Predicate Dictionary for Polarity Classification of Product Reviews," Journal of KIISE: Software and Applications, Vol.38, No.3 (2013), 157-168. 

  16. Song S. I., D. J. Lee and S. G. Lee, "Identifying Sentiment Polarity of Korean Vocabulary Using PMI," Proceedings of the Korean Information Science Society Conference, Vol.37, No.1(2010), 260-265. 

  17. Turney P. D. and M.L. Littman, "Unsupervised Learning of Semantic Orientation from a Hundred-Billion-Word Corpus," National Research Council, Institute for Information Technology, Technical Report(2002), ERB-1094. 

  18. Turney P. D., and M. L. Littman, "Measuring Praise and Criticism: Inference of Semantic Orientation from Association," ACM Transactions on Information Systems (TOIS), Vol.21, No.4(2003), 315-346. 

  19. Yeon J. H., D. J. Lee, J. H. Shim and S. G. Lee, "Product Review Data and Sentiment Analytical Processing Modeling," The Journal of Society for e-Business Studies, Vol.16, No.4(2011), 125-137. 

  20. Yu E. J., Y. S. Kim, N. Y. Kim and S. R. Jeong, "Predicting the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary," Journal of Intelligent Information Systems, Vol.19, No.1(2013), 95-10. 

저자의 다른 논문 :

관련 콘텐츠

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로