$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석
Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode 원문보기

지능정보연구 = Journal of intelligence and information systems, v.25 no.4, 2019년, pp.141 - 154  

박호연 (동국대학교_서울 일반대학원 경영정보학과) ,  김경재 (동국대학교_서울 경영대학 경영정보학과)

초록
AI-Helper 아이콘AI-Helper

인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

Abstract AI-Helper 아이콘AI-Helper

Rapid growth of internet technology and social media is progressing. Data mining technology has evolved to enable unstructured document representations in a variety of applications. Sentiment analysis is an important technology that can distinguish poor or high-quality content through text data of p...

주제어

표/그림 (10)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 선행연구에서는 주로 인공 신경망, SVM 등의 단순 기계학습기법을 활용하여 왔으나 전술한 특성 때문에 분류 성과가 미흡한 경우가 많았다. 본 연구에서는 이러한 한계점을 보완하고자 최근에 기계학습 분야에서 활발하게 연구되고 있는 대표적인 딥러닝 기법과 본 연구에서 영화 리뷰의 감성분석에 적합할 것으로 생각되어 CNN-LSTM 조합모델을 제안한다.
  • 하지만 실제 응용에 있어서는 과적합이 되지 않도록 견고성을 확보하는 것이 중요하다. 특히, 딥러닝 기법은 이미지 인식 등에서 활발하게 이용되고 있으나 영화 리뷰 등의 텍스트 분석 사례는 적기 때문에 본 연구에서 영화 리뷰 데이터의 극성 분류문제에 이용해 보고자 한다.

가설 설정

  • 본 연구의 결과에 대한 실무적 시사점은 딥러닝에 기반한 감성분석이 감성 예측을 더욱 정교하게 하여 흥행요인 분석 등에 활용될 수 있을 것이다. 정교한 영화 흥행요인의 분석은 영화 산업의 발전에 기여할 수 있을 것이다. 또한, 영화 리뷰에 대한 텍스트 분석은 영화 추천시스템에 활용될 수 있으며, 사용자의 평점 데이터에만 의존하는 기존의 추천시스템에 비해 감성분석의 결과를 고려하여 보다 정교한 추천 결과를 도출할 수 있을 것으로 기대된다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
딥러닝이란? 딥러닝은 일반적으로 기계학습기법의 하나인 신경망의 계층을 심화시킨 알고리즘을 의미한다. 전통적인 기계학습기법은 분류에 대한 특징 집합을 따로 추출하여야 하지만, 딥러닝은 특징 집합을 추출하는 과정뿐만 아니라, 복잡한 특징을 자동으로 추출할 수 있다 (Liu et al.
감성분석에 많이 활용되는 기법은? 나이브베이즈 (NB, Naive Bayes), 의사결정나무, kNN, 인공신경망, SVM (support vector machines), 최대 엔트로피 등이 지도학습기법 중 감성분석에 많이 활용되는 기법이다 (Appel et al., 2015).
감성분석의 긍정 및 부정의 특징 추출을 위해 만들어진 CNN의 특징은? 기존 기계학습과 달리 CNN은 convolution layer를 적용하여 특징의 자동 추출이 가능하고, 대규모 병렬 처리가 가능하다. 한편, LSTM은 CNN과 달리 대규모 병렬처리가 가능하지 않지만, RNN과는 다르게 원하는 시기에 진행 및 제어 할 수 있는 입력, 출력, 망각 게이트가 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (20)

  1. Abid, F., M. Alam, M. Yasir, and C. Li, "Sentiment analysis through recurrent variants latterly on convolutional neural network of Twitter," Future Generation Computer Systems, Vol.95(2019), 292-308. 

  2. Appel, O., F. Chiclana and J. Carter, "Main concepts, state of the art and future research questions in sentiment analysis," Acta Polytechnica Hungarica, Vol.12, No.3(2015), 87-108. 

  3. Baydogan, M. G., G. Runger, and E. Tuv, "A bag-of-features framework to classify time series," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.35, No.11(2013), 2796-2802. 

  4. Bengio, Y., P. Simard, and P. Frasconi, "Learning long-term dependencies with gradient descent is difficult," IEEE Transactions on Neural Networks, Vol.5, No.2(1994), 157-166. 

  5. Ferguson, P., N. O'Hare, M. Davy, A. Bermingham, P. Sheridan, C. Gurrin and A. F. Smeaton, "Exploring the use of paragraph-level annotations for sentiment analysis of financial blogs," Proceedings of WOMAS 2009-Workshop on Opinion Mining and Sentiment Analysis, (2009). 

  6. Graves, A., "Long short-term memory," Supervised Sequence Labelling with Recurrent Neural Networks, Springer, Berlin, Heidelberg, 2012 

  7. Hyun, J., S. Ryu, and S.-Y. Lee, "How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores," Journal of Intelligence and Information Systems, Vol.25, No.1(2019), 219-239. 

  8. Kim, Y., and M. Song, "A study on analyzing sentiments on movie reviews by multi-level sentiment classifier," Journal of Intelligence and Information Systems, Vol.22, No.3(2016), 71-89. 

  9. Lee, S.-H., J. Cui, and J.-W. Kim, "Sentiment analysis on movie review through building modified sentiment dictionary by movie genre," Journal of Intelligence and Information Systems, Vol.22, No.2(2016), 97-113. 

  10. Liu, P., X. Qiu, and X. Huang, "Recurrent neural network for text classification with multi-task learning," arXiv 1605.05101, 2016. 

  11. Liu, S., and J.-H. Chen, "A multi-label classification based approach for sentiment classification," Expert Systems with Applications, Vol.42, No.3(2015), 1083-1093. 

  12. Lochter, J. V., R. F.Zanetti, D. Reller, and T. A. Almeida, "Short text opinion detection using ensemble of classifiers and semantic indexing," Expert Systems with Applications, Vol.62, (2016), 243-249. 

  13. Nguyen, H., and N. M. Le, "An ensemble method with sentiment features and clustering support," Neurocomputing, Vol.370(2019), 155-165. 

  14. Pak, A. and P. Paroubek, "Twitter as a corpus for sentiment analysis and opinion mining," Proceedings of the Seventh International Conference on Language Resources and Evaluation, (2010), 1320-1326. 

  15. Pang, B., L. Lee, and S. Vaithyanathan, "Thumbs up?: sentiment classification using machine learning techniques," Proceedings of the ACL-02 conference on Empirical methods in Natural Language Processing, 2002. 

  16. Rao, G., W. Huang, Z. Feng, and Q. Cong, "LSTM with sentence representations for document level sentiment classification," Neurocomputing, Vol.308(2018), 49-57. 

  17. Sailunaz, K., and R. Alhajj, "Emotion and sentiment analysis from Twitter text," Journal of Computational Science, Vol.36(2019), 101003. 

  18. Shuang K., Z. Zhang, H. Guo, and J. Loo, "A sentiment information Collector-Extractor architecture based neural network for sentiment analysis," Information Sciences, Vol.467 (2018), 549-558. 

  19. Tang, F., L. Fu, B. Yao, and W. Xu, "Aspect based fine-grained sentiment analysis for online reviews," Information Sciences, Vol.488(2019), 190-204. 

  20. Xu, J., D. Chen, X. Qiu, and X. Huang, "Cached long short-term memory neural networks for document-level sentiment classification," arXiv preprint arXiv:1610.04989, 2016. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로