$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

비정형 문서에서 감정과 상황 정보를 이용한 감성 예측
Sentiment Prediction using Emotion and Context Information in Unstructured Documents 원문보기

융합정보논문지 = Journal of Convergence for Information Technology, v.10 no.10, 2020년, pp.40 - 46  

김진수 (안양대학교 아리교양대학)

초록
AI-Helper 아이콘AI-Helper

인터넷의 발전으로 사용자들은 자신의 경험이나 의견을 공유한다. 영화평과 같은 비정형 문서의 전체적인 감정이나 장르 등의 정보를 고려하지 않고 연관된 키워드를 사용하기 때문에 적절한 감정 상황에 따른 감성 정확도를 저해한다. 따라서 사용자들이 작성한 비정형 문서가 속한 장르나 전반적인 감정 등의 정보를 기반으로 감성을 예측하는 시스템을 제안한다. 먼저, 비정형 문서로부터 기쁨, 화남, 공포, 슬픔 등의 감정 집합과 연관된 대표 키워드를 추출하고, 감정 특징단어들의 정규화된 가중치와 비정형 문서의 정보를 훈련 집합으로 CNN과 LSTM을 조합한 시스템에 훈련한다. 최종적으로 영화 정보와 형태소 분석기와 n-gram을 통해 추출한 정제된 단어들과 이모티콘, 이모지 등을 테스트함으로써 감정을 이용한 감성 예측 정확도와 F-measure 측면에서 향상됨을 보였다. 제안한 예측시스템은 슬픈 영화에서 슬픈 단어의 사용과 공포 영화에서 무서운 단어 등의 사용으로 인해 부정으로 판단하는 오류를 피함으로써, 감성을 상황에 따라 적절하게 예측할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

With the development of the Internet, users share their experiences and opinions. Since related keywords are used witho0ut considering information such as the general emotion or genre of an unstructured document such as a movie review, the sensitivity accuracy according to the appropriate emotional ...

주제어

표/그림 (5)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 즉, 대표 키워드 추출은 감정 예측을 위해 훈련에 필요한 차원을 감소시키는 데 유용하게 사용된다. 따라서 본 연구에서는 비정형 문서의 감정을 대표하는 키워드의 빈도 및 감정 가중치 기반의 키워드를 추출하고 감정 데이터베이스를 구성한다. 영화평의 경우 긴 문서와 달리 짧은 문단으로 작성되어 역문단빈도수(TF∙IPF)[12]를 사용하여 각 감정 집합의 대표 감정 키워드를 추출한다.
  • 본 연구에서는 사용자가 작성한 영화평과 같은 비정형 문서로부터 데이터를 획득하여 영화에 대한 감정을 예측하고 예측된 감정과 영화의 상황 정보를 고려하여 해당 영화에 대한 긍정 및 부정을 예측하는 시스템을 구축하고자 한다. 제안하는 방법은 감정 및 감성 상호작용을 위한 특징 추출을 위해 먼저 비정형 문서에 표현된 감정 키워드를 형태소분석을 통해 추출한다.
  • 영화평, 댓글, 상품평 등과 같은 비정형 문서로부터 딥러닝을 활용하여 감정을 통해 긍정적이거나 부정적인 감성의 성향을 파악할 수 있다. 본 연구에서는 영화가 지닌 상황 정보와 영화평을 딥러닝으로 분석하여 감정 및 감성을 예측한다. 먼저 최종적인 감성 예측을 위해 각 감정별로 수집한 비정형 문서들로부터 형태소를 분석하여 감정 키워드를 추출하고 정규화된 연관 가중치를 계산한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
오피니언 마이닝이란? 오피니언 마이닝은 텍스트에 표현된 개인적인 느낌이나 관점, 감정, 신념 등을 분석하여 객관화 및 정량화 하여 긍정 및 부정적 감성을 분석하는 것이다[5]. 다른 사용자들에게 자신의 경험, 의견, 느낌 등에 대해 좋고 싫은 다양한 감정을 표현하여 긍정적 또는 부정적 평가에 사용된다.
오피니언 마이닝은 어느 분야에서 사용되고 있는가? 특히, 자연어로 표현된 텍스트로부터 데이터 분석을 통해 의견이나 성향 등을 예측하여 유의미한 정보를 획득하려는 오피니언 마이닝 연구가 진행되고 있다. 오피니언 마이닝은 상업 분야뿐만 아니라, 정치, 경제, 사회분야 등에서 널리 사용되며, 수치화 및 시각화를 통해 직관적인 감성 판단으로 의사결정에 반영할 수 있으며, 최근까지 자연어 처리 분야에서도 활발히 연구되고 있다[1,2]. 영화평, 상품평, 인터넷 댓글, SNS 등의 내용은 작성자가 상대에게 정보나 견해를 신속하게 표현하기 위해 짧고 핵심적인 의미의 단어를 표현하여 작성한다.
오피니언 마이닝에서 감성 분석을 위해 어떤 자원을 수집하고 구축하는가? 다른 사용자들에게 자신의 경험, 의견, 느낌 등에 대해 좋고 싫은 다양한 감정을 표현하여 긍정적 또는 부정적 평가에 사용된다. 감성 분석을 위해 감성 사전이나 감성 의미망과 같은 자원을 수집하고 구축한다. Thayer가 제시한 감정은 긍정과 부정의 척도에 따른 밸러스와 High, Low의 활성 정도에 따라 Excited, Happy, Pleased, Relaxed, Peaceful, Calm, Sleepy, Bored, Sad, Nervous, Angry, 그리고 Annoying으로 분류한다[6].
질의응답 정보가 도움이 되었나요?

참고문헌 (13)

  1. S. D. Kim, E. B. Park, S. J. Lee & K. Y. Kim. (2010). A Syllable Kernel based Sentiment Classification for Movie Reviews. Journal of Korean Institute of Intelligent Systems, 20(2), 202-207. DOI : 10.5391/JKIIS.2010.20.2.202 

  2. K. Y. Kim & C. S. Kim. (2009). A String Kernel based Sentiment Classification for Blog Text. Proceedings of KIIS Fall Conference 2009, 19(2), 199-201. DOI : 10.5391/JKIIS.2012.22.5.563 

  3. S. Seo & J. Kim, (2016). Sentiment Analysis Research Trend Based on Deep Learning. The Korea Multimedia Society, 20(3), 8-22. 

  4. A. Rexha, M. Kroll, M. Dragoni & R. Kern. (2016). Polarity Classification for Target Phrases in Tweets: A Word2Vec Approach. ESWC 2016. LNCS, 9989, 217-223. DOI : 10.1007/978-3-319-47602-5_40 

  5. M. Kang, J. Ahn & K. Lee. (2018). Opinion mining using ensemble text hidden Markov models for text classification. Expert Systems with Applications, 94, 218-227. DOI : 10.1016/j.eswa.2017.07.019 

  6. R. Thayer. (1989). The Biopsychology of Mood and Arousal. Oxford University Press. 

  7. K. R. Scherer & P. Ekman. (2014). Approaches to Emotion. Psychology Press, New York. 

  8. M. Chang. (2012). Empirical Sentiment Classification Using Psychological Emotions and Social Web Data. Journal of Korean Institute of Intelligent Systems, 22(5), 563-569. DOI : 10.5391/JKIIS.2012.22.5.563 

  9. Y. Kim. (2014). Convolutional neural networks for sentence classification. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), 1746-1751. DOI : 10.3115/v1/D14-1181 

  10. F. Abid, M. Alam, M. Yasir & C. Li. (2019). Sentiment analysis through recurrent variants latterly on convolutional neural network of Twitter. Future Generation Computer Systems, (95), 292-308. DOI : 10.1016/j.future.2018.12.018 

  11. E. Park & S. Cho. (2014). KoNLPy: Korean natural language processing in Python. Proceedings of the 26th Annual Conference on Human & Cognitive Language Technology, Chuncheon, Korea. 133-136. 

  12. J. Kim. (2014). Emotion Prediction of Document using Paragraph Analysis. Journal of Digital Convergence, 12(12), 249-255. DOI : 10.14400/JDC.2014.12.12.249 

  13. Unicode Emoji. http://www.unicode.org/reports/tr51 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로