최근 스마트폰과 태블릿 PC 등의 스마트 기기들의 발전으로 인해 SNS(Social Network Service) 사용자가 증가함에 따라 SNS 정보를 이용한 사용자 감정 분류 방법에 대한 기법들이 활발하게 연구되고 있다. 사용자 감정 분류는 SNS 게시글의 텍스트, 이미지 등을 이용하여 감정을 분류하는 것을 말한다. 본 논문에서는 텍스트에서 대표 형용사를 추출하고 이미지에서 Canny 알고리즘과 삼각함수를 이용해 대표 도형에 대한 값을 추출하여 사용자의 감정을 분류하는 방법을 제안한다. 텍스트에서 추출한 대표 형용사는 텍스트에서 추출한 형용사 중에 빈도수가 가장 높은 형용사로 선정하였으며, 영어 감정어휘 사전인 SentiWordNet을 이용하여 긍정-부정의 수치를 측정했다. 이미지에서 추출되는 도형에서 삼각형, 사각형, 원중에 추출되는 도형을 대표 도형으로 선정했으며, 대표 도형의 종류와 기울기에 따라 쾌-불쾌 수치를 측정하여 사용자의 감정을 분류했다. 최종적으로 Plutchik의 감정 바퀴를 긍정-부정과 쾌-불쾌의 수치를 나타내는 x축과 y축을 갖는 좌표평면으로 재정의하고 대표 형용사와 대표 도형의 값을 재정의한 Plutchik의 감정 바퀴의 좌표 평면에 나타내어 사용자의 감정 분류를 수행한다.
최근 스마트폰과 태블릿 PC 등의 스마트 기기들의 발전으로 인해 SNS(Social Network Service) 사용자가 증가함에 따라 SNS 정보를 이용한 사용자 감정 분류 방법에 대한 기법들이 활발하게 연구되고 있다. 사용자 감정 분류는 SNS 게시글의 텍스트, 이미지 등을 이용하여 감정을 분류하는 것을 말한다. 본 논문에서는 텍스트에서 대표 형용사를 추출하고 이미지에서 Canny 알고리즘과 삼각함수를 이용해 대표 도형에 대한 값을 추출하여 사용자의 감정을 분류하는 방법을 제안한다. 텍스트에서 추출한 대표 형용사는 텍스트에서 추출한 형용사 중에 빈도수가 가장 높은 형용사로 선정하였으며, 영어 감정어휘 사전인 SentiWordNet을 이용하여 긍정-부정의 수치를 측정했다. 이미지에서 추출되는 도형에서 삼각형, 사각형, 원중에 추출되는 도형을 대표 도형으로 선정했으며, 대표 도형의 종류와 기울기에 따라 쾌-불쾌 수치를 측정하여 사용자의 감정을 분류했다. 최종적으로 Plutchik의 감정 바퀴를 긍정-부정과 쾌-불쾌의 수치를 나타내는 x축과 y축을 갖는 좌표평면으로 재정의하고 대표 형용사와 대표 도형의 값을 재정의한 Plutchik의 감정 바퀴의 좌표 평면에 나타내어 사용자의 감정 분류를 수행한다.
According to increasing SNS users and developing smart devices like smart phone and tablet PC recently, many techniques to classify user emotions with social network information are researching briskly. The use emotion classification stands for distinguishing its emotion with text and images listed ...
According to increasing SNS users and developing smart devices like smart phone and tablet PC recently, many techniques to classify user emotions with social network information are researching briskly. The use emotion classification stands for distinguishing its emotion with text and images listed on his/her SNS. This paper suggests a method to classify user emotions through sampling a value of a representative figure on a trigonometrical function, a representative adjective on text, and a canny algorithm on images. The sampling representative adjective on text is selected as one of high frequency in the samplings and measured values of positive-negative by SentiWordNet. Figures sampled on images are selected as the representative in figures; triangle, quadrangle, and circle as well as classified user emotions by measuring pleasure-unpleased values as a type of figures and inclines. Finally, this is re-defined as x-y graph that represents pleasure-unpleased and positive-negative values with wheel of emotions by Plutchik. Also, we are anticipating for applying user-customized service through classifying user emotions on wheel of emotions by Plutchik that is redefined the representative adjectives and figures.
According to increasing SNS users and developing smart devices like smart phone and tablet PC recently, many techniques to classify user emotions with social network information are researching briskly. The use emotion classification stands for distinguishing its emotion with text and images listed on his/her SNS. This paper suggests a method to classify user emotions through sampling a value of a representative figure on a trigonometrical function, a representative adjective on text, and a canny algorithm on images. The sampling representative adjective on text is selected as one of high frequency in the samplings and measured values of positive-negative by SentiWordNet. Figures sampled on images are selected as the representative in figures; triangle, quadrangle, and circle as well as classified user emotions by measuring pleasure-unpleased values as a type of figures and inclines. Finally, this is re-defined as x-y graph that represents pleasure-unpleased and positive-negative values with wheel of emotions by Plutchik. Also, we are anticipating for applying user-customized service through classifying user emotions on wheel of emotions by Plutchik that is redefined the representative adjectives and figures.
상황이나 환경 등의 외부 자극에 따라 사람마다 다른 감정을 느낄 수 있으므로, 사용자의 감정을 단순히 측정하기는 쉽지 않다. 본 논문에서는 SNS 게시글 내의 텍스트와 이미지를 사용하여 사용자의 감정을 측정하는 연구를 수행하고자 한다. 본 논문에서는 텍스트에서 대표 형용사를 추출한 후 영어 감정 어휘 사전인 SentiWordNet을 이용하여 긍정-부정의 수치로 나타내고, 이미지에서는 Canny 알고리즘을 이용해 대표 도형을 추출하여 도형의 종류를 식별하고 삼각함수를 이용해 도형의 기울기를 구하여 쾌-불쾌 수치를 측정한다.
제안 방법
본 논문에서는 SNS 게시글 내의 텍스트와 이미지를 사용하여 사용자의 감정을 측정하는 연구를 수행하고자 한다. 본 논문에서는 텍스트에서 대표 형용사를 추출한 후 영어 감정 어휘 사전인 SentiWordNet을 이용하여 긍정-부정의 수치로 나타내고, 이미지에서는 Canny 알고리즘을 이용해 대표 도형을 추출하여 도형의 종류를 식별하고 삼각함수를 이용해 도형의 기울기를 구하여 쾌-불쾌 수치를 측정한다. 사람의 8가지 기본 감정을 동심원 형태로 나타내는 Plutchik의 감정 바퀴를 긍정-부정의 축과 쾌-불쾌의 축을 가진 좌표평면으로 재정의하고 대표 형용사와 대표 도형의 값을 재정의한 Plutchik의 감정 바퀴의 좌표평면에 나타내어 사용자의 감정을 분류한다.
본 논문에서는 텍스트에서 대표 형용사를 추출한 후 영어 감정 어휘 사전인 SentiWordNet을 이용하여 긍정-부정의 수치로 나타내고, 이미지에서는 Canny 알고리즘을 이용해 대표 도형을 추출하여 도형의 종류를 식별하고 삼각함수를 이용해 도형의 기울기를 구하여 쾌-불쾌 수치를 측정한다. 사람의 8가지 기본 감정을 동심원 형태로 나타내는 Plutchik의 감정 바퀴를 긍정-부정의 축과 쾌-불쾌의 축을 가진 좌표평면으로 재정의하고 대표 형용사와 대표 도형의 값을 재정의한 Plutchik의 감정 바퀴의 좌표평면에 나타내어 사용자의 감정을 분류한다. 본 논문의 구성은 다음과 같다.
대상 데이터
인스타그램 게시글에서 210개의 이미지와 본문 텍스트, 2,940개의 댓글을 수집하여 실험 하였으며, 이미지와 텍스트를 이용 하여 추출한 쾌-불쾌 수치와 긍정-부정 수치를 재정의한 Plutchik의 감정 바퀴에 표현하여 최종적인 사용자의 감정을 분류한다. 심리학이나 철학 등에서는 기본적으로 몇 가지 감정을 기본 감정으로 분류하고, 나머지 유사한 감정들을 기본 감정들의 조합으로 분류하고 있다.
성능/효과
쾌-불쾌 수치와 긍정-부정 수치를 사용하기 위해서 기존에 연구되어 있던 쾌-불쾌 수치와 SentiWordNet의 긍정-부정 수치를 재정의하였고 재정의한 쾌-불쾌 수치와 긍정-부정 수치를 이용하여 재정의한 Plutchik의 감정 바퀴의 좌표 평면에 표현함으로써 사용자의 감정을 분류하였다. 제안하는 방법으로 인스타그램 게시글에서 210개의 이미지와 본문 텍스트, 2,940개의 댓글을 이용하여 실험한 결과 73.33%의 사용자 감정을 분류할 수 있었다. 인스타그램 게시글에서 수집한 이미지와 텍스트에서 대표 도형과 대표 형용사가 추출되지 않는 경우 정확한 사용자의 감정 분류가 정확하게 되지 않았다.
후속연구
향후 연구로는 본 연구를 통해 분류된 사용자 감정을 기반으로 한 감정 마케팅 방법에 관한 연구, 사용자 감정기반의 영화, 드라마, 음악 등의 콘텐츠 추천에 관한 연구로 발전시킬 수 있을 것으로 보인다. 또한, 본 연구에서는 게시글의 이미지에서 추출한 도형의 정형성을 고려하여 쾌-불쾌 수치를 측정하지 않았지만, 이미지에서 도형의 정형성까지 고려하여 쾌-불쾌 수치를 측정한다면 이미지에서 더 정확한 도형을 추출할 수 있을 것으로 보이며, 더욱 정확한 감정 분류를 할 수 있을 것으로 보인다. 텍스트를 이용한 긍정-부정 수치를 측정하는데 있어서도 형용사만을 추출하는 것이 아니라 명사, 동사, 부사를 포함하여 긍정-부정 수치를 측정하는 연구로 확장되어야 한다.
또한, 본 연구에서는 게시글의 이미지에서 추출한 도형의 정형성을 고려하여 쾌-불쾌 수치를 측정하지 않았지만, 이미지에서 도형의 정형성까지 고려하여 쾌-불쾌 수치를 측정한다면 이미지에서 더 정확한 도형을 추출할 수 있을 것으로 보이며, 더욱 정확한 감정 분류를 할 수 있을 것으로 보인다. 텍스트를 이용한 긍정-부정 수치를 측정하는데 있어서도 형용사만을 추출하는 것이 아니라 명사, 동사, 부사를 포함하여 긍정-부정 수치를 측정하는 연구로 확장되어야 한다.
SNS 사용자의 게시글을 통해 감정을 분류함으로써 감정기반의 다양한 연구에 적용이 가능할 것으로 보인다. 향후 연구로는 본 연구를 통해 분류된 사용자 감정을 기반으로 한 감정 마케팅 방법에 관한 연구, 사용자 감정기반의 영화, 드라마, 음악 등의 콘텐츠 추천에 관한 연구로 발전시킬 수 있을 것으로 보인다. 또한, 본 연구에서는 게시글의 이미지에서 추출한 도형의 정형성을 고려하여 쾌-불쾌 수치를 측정하지 않았지만, 이미지에서 도형의 정형성까지 고려하여 쾌-불쾌 수치를 측정한다면 이미지에서 더 정확한 도형을 추출할 수 있을 것으로 보이며, 더욱 정확한 감정 분류를 할 수 있을 것으로 보인다.
질의응답
핵심어
질문
논문에서 추출한 답변
SentiWordNet는 무엇인가?
인스타그램 사용자들이 이미지와 함께 게시한 본문의 내용과 댓글을 이용하여 대표 형용사를 추출하는 방법에 대해 기술한다. SentiWordNet은 오피니언 마이닝을 위한 어휘 사전으로 WordNet의 동의어 집합에 긍정, 부정, 중립의 감정 점수를 부여한다[17]. 전 세계 300여 개 이상의 연구 그룹에서 활용되고 있으며, 현재는 WordNet3.
사용자 감정 분류를 이용하여 어떤 것을 제공할 수 있는가?
이에 따라 SNS를 이용한 다양한 연구가 진행되고 있는데 그중 하나가 사용자 감정 분류이다. SNS 사용자들은 자신의 계정을 이용해 일상생활, 자신의 상태, 기분 등을 글이나 이미지, 동영상 등으로 게시하는데 이를 이용해서 감정 분류를 하고, 사용자의 감정에 맞는 다양한 서비스를 제공할 수 있다. 감정이란 어떤 현상이나 사건에 대하여 일어나는 마음이나 느끼는 기분을 뜻하는 단어이다.
감정이란 무엇인가?
SNS 사용자들은 자신의 계정을 이용해 일상생활, 자신의 상태, 기분 등을 글이나 이미지, 동영상 등으로 게시하는데 이를 이용해서 감정 분류를 하고, 사용자의 감정에 맞는 다양한 서비스를 제공할 수 있다. 감정이란 어떤 현상이나 사건에 대하여 일어나는 마음이나 느끼는 기분을 뜻하는 단어이다. 상황이나 환경 등의 외부 자극에 따라 사람마다 다른 감정을 느낄 수 있으므로, 사용자의 감정을 단순히 측정하기는 쉽지 않다.
참고문헌 (20)
박지수, 김무철, 노승민, "멀티미디어 콘텐츠의 맞춤형 정보 제공 연구", 한국전자거래학회지, Vol.20, No3, August 2015, pp.79-87
노희용, 송기식, 이성주, "SNS정보를 활용한 감성기반 서비스 추천-영화추천 서비스 사례", 한국경영학회 통합학술발표논문집, August 2014, pp380-391
김경민, 김동윤, 이지형, "트위터를 활용한 감정 기반의 영화 유사도 측정", 한국지능시스템학회 논문지, June 2014, pp.292-297
https://github.com/sachin-handiekar/jInstagram
John Canny, "A computational Approach to Edge Detection", IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. PAMI-8, November 1986, pp. 679-698
유재근, "삼각함수 개념의 역사적 분석", 대한수학교육학회지, Vol.24, No.4,, November 2014, pp.607-622
정대현, 한광희, "형태를 통해서 느끼는 감성 -기본 도형을 중심으로-", 한국HCI학회논문집, 2007, pp. 445-451
Andrea Esuli, and Fabrizio Sebastiani, "SENTIWORDNET: A Publicly Available Lexical Resuource for Opinion Minng", In Proceedings of the 5th Conference on Language Resources and Evaluation, 2006
Stefano Baccianella, Andrea Esuli, Fabrizio Sebastiani, "SentiWordNet 3.0:An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining", Proceeing of the International Conference on Language Resources and Evalution(LREC), 2010
http://nlp.stanford.edu/software/tagger.shtml
R. Plutchik, "Emotions and Life: Perspectives From Psychology, Biology, and Evolution" American psychological Association, 2003
※ AI-Helper는 부적절한 답변을 할 수 있습니다.