$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

감성 강도를 고려한 감성 분석 평가집합 구축
Constructing an Evaluation Set for Korean Sentiment Analysis Systems Incorporating the Category and the Strength of Sentiment 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.12 no.11, 2012년, pp.30 - 38  

김도연 (전남대학교 전자컴퓨터공학과) ,  오영 (전남대학교 전자컴퓨터공학과) ,  박혁로 (전남대학교 전자컴퓨터공학과)

초록
AI-Helper 아이콘AI-Helper

감성 분석은 블로그와 트위터 같은 다양한 소셜 미디어에서 사용자들이 표현하는 감정의 종류를 분석하고 추출하는 연구이다. 현재 감성 분석 연구는 꾸준히 계속되고 있지만, 한국어의 감성 분석 평가 집합은 아직 없다. 본 논문에서는 감성 분석을 평가할 수 있는 평가집합을 구축한다. 평가집합에서는 사용자의 감성에 대한 극성뿐만 아니라 감성의 종류와 강도까지 고려한 평가집합을 구축하였다. 이를 위해 감성의 종류는 긍정에서 7가지의 범주와 부정에서 15가지의 범주를 나누고, 각 범주별로 1~3까지의 강도를 설정하였다. 또한 각 범주에 속하는 어휘에 대해서도 1~3까지의 강도를 설정하였다. 평가집합의 데이터는 다양한 소셜 미디어에서 3,270 문장을 추출하여 구축하였으며, 각 문장에 대해 5 명이 감성의 종류와 강도를 태깅하였다. 구축한 평가집합에서 5명의 일치도는 극성의 경우 93 %, 감성의 종류는 70 %, 강도는 58 % 로 나타났다. 이는 독일어와 스페인어의 평가 집합 보다 일치도가 높게 나타났다. 이 결과는 제안한 평가 집합이 신뢰할 만한 자원으로 다른 감성 분석 시스템의 평가데이터로 사용될 수 있음을 보여준다.

Abstract AI-Helper 아이콘AI-Helper

Sentiment analysis is concerned with extracting and analyzing different kinds of user sentiment expressed in a variety of social media such as blog and twitter. Although sentiment analysis techniques are actively studied for these days, evaluation sets are not developed yet for Korean sentiment anal...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 절에서는 극성 분류뿐만 아니라 세부 감성 분류를 하기 위한 분류 기준과 범주별 강도(1~3)에 대하여 설명한다. 또한, 각 범주별 어휘 목록들을 기술하고 어휘들 사이의 강도(1~3)와 정도 부사어의 강도(1~3)에 대하여 자세히 살펴보고자 한다.
  • 본 연구에서는 문장의 극성만 나타내는 것이 아니라 어떠한 감정을 표현하는지에 대해서도 세밀하게 태깅 하는 평가집합이다. 따라서 분류의 범주가 너무 많으면 태깅하기 어렵고, 너무 적으면 정확히 어떠한 감정을 나타내려고 하는지 분류하기 어렵다.
  • 그러나 아직까지 정도 부사어에 대한 강도의 등급을 정한 연구는 없었다. 본 연구에서는 정도 부사어에 별도로 강도를 주어 감성어휘의 강도와 정도 부사어의 강도를 더하여 사용할 수 있도록 하였다. 이는 시스템의 성격에 따라 가중치를 더 줄 수도 있고, 뺄 수도 있으며 점수로 계산시 강도3= 0.
  • 그러나 아직까지 한국어에 대한 평가 집합은 존재하지 않는다. 이에 본 논문에서는 동양의 정서에 맞는 공자의 분류체계를 바탕으로 한국어에 적합한 감성 분류 체계를 만들고, 이 분류 체계를 바탕으로 극성 분류 뿐만 아니라 세부 감정 분류, 그리고 각 어휘에 대한 강도와 정도 부사어의 강도까지 나타내는 평가 집합을 구축하고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
감성이란 무엇인가요? 감성이란 '어떤 현상이나 일에 대하여 일어나는 마음이나 느끼는 기분'이다. 감성 어휘는 객관적 가치 평가보다는 주로 내면이나 주관적 감정 또는 심리가 작용하는 의미 영역을 묘사한 것이다.
감성 어휘란 무엇인가요? 감성이란 '어떤 현상이나 일에 대하여 일어나는 마음이나 느끼는 기분'이다. 감성 어휘는 객관적 가치 평가보다는 주로 내면이나 주관적 감정 또는 심리가 작용하는 의미 영역을 묘사한 것이다. 이러한 감성을 분석한다는 것은 자연언어처리와 전산언어학 그리고 텍스트 분석론을 활용하여 원 자료에서 주관적인 정보를 발견하고 추출하는 과정이다[1].
감성의 분류 체계를 이용하여 감성의 종류를 분석하고 분류하는 연구는 크게 3단계로 나눌 수 있는데 그 3단계는 무엇인가요? 감성의 분류 체계를 이용하여 감성의 종류를 분석하고 분류하는 연구는 크게 세 가지의 단계로 나눌 수 있다. 첫 번째 단계는 감성 정보가 들어 있는 주관적인 생각이나 느낌을 표현하는 문장을 추출하고, 다음 단계에서 문서 또는 문장의 극성(긍정, 부정)을 나눈다. 마지막 단계는 문서 또는 문장이 어느 정도의 주관성을 갖는지 그 강도를 구하는 강도 분류 연구이다[2][3]. 첫 번째 단계인 감성 정보 분류는 감성 분석 분류과정 중에서 아주 기초적인 과정으로서 문장 중에서 가치 있는 감성 정보들을 추출하는 과정이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. B. Pang, and L. Lee, "Opinion Mining and Sentiment Analysis," Foundations and Trends in Information Retrieval: Vol.2, No.1-2, pp.1-135, 2008. 

  2. 김정호, 김명규, 차명훈, 인주호, 채수환, "한국어 특성을 고려한 감성 분류", 한국감성과학회지 제13권, 제3호, pp.449-458, 2010. 

  3. H. Tang, S. Tan, and X. Cheng, " A survey on sentiment detection of reviews," Expert Systems with Applications, Vol.36, pp.10760-10773, 2009. 

  4. 김은영, 국어 감정 동사 연구, 전남대학교 대학원, 박사학위논문, 2004. 

  5. P. Harland, "HOW THE BRAIN FEELS," Emotion and Cognition in Neuro-Linguistic Psychotherapy, Rapport, Journal of the Association for NLP (UK), Issue 57, 2002. 

  6. R. Plutchik and H. Kellerman, Emotion: Theory, research, and experience: Vol.1, Theories of emotion.1, New York: Academic, 1980. 

  7. http://www.cs.cornell.edu/people/pabo/movie-review-data 

  8. http://condensr.com 

  9. http://www.wjh.harvard.edu/-inquirer/homecat.htm 

  10. 김기홍, "감정언어와 그의 문법성 고찰", 동서문화 11, pp.161-181, 1979. 

  11. C. E. Osgood,, "Cross-Cultural comparability in Attitude Measurement via Muttilingual Semantic Differentials," in Social Psychology, pp.95-106, 1965. 

  12. 손춘섭, "정도부사의 의미와 기능에 대한 고찰," 한국어의미학회, 한국어의미학, 제9권, pp.97-130, 2001. 

  13. J. M. Schulz, C. Womser-Hacker, and T. Mandl, "Multilingual corpus development for opinion mining," In Proc. of LREC'10, pp.3409-3412, 2010. 

  14. 김재원, 곽훈성, 장재우, "감성어의 비중처리와 퍼지추론에 의한 평가 방법," 한국콘텐츠학회논문지, 제9권, 제1호, pp.30-35, 2011. 

  15. http://www.wordnet.co.kr/ 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로