In recent times, studies sentiment analysis are being actively conducted by implementing natural language processing technologies for analyzing subjective data such as opinions and attitudes of users expressed on the Web, blogs, and social networking services (SNSs). Conventionally, to classify the ...
In recent times, studies sentiment analysis are being actively conducted by implementing natural language processing technologies for analyzing subjective data such as opinions and attitudes of users expressed on the Web, blogs, and social networking services (SNSs). Conventionally, to classify the sentiments in texts, most studies determine positive/negative/neutral sentiments by assigning polarity values for sentiment vocabulary using sentiment lexicons. However, in this study, sentiments are classified based on Thayer's model, which is psychologically defined, unlike the polarity classification used in opinion mining. In this paper, as a method for classifying the sentiments, sentiment categories are proposed by extracting sentiment keywords for major sentiments by using hashtags, which are essential elements of Instagram. By applying sentiment categories to user posts, sentiments can be determined through the similarity measurement between the sentiment adjective candidates and the sentiment keywords. The test results of the proposed method show that the average accuracy rate for all the sentiment categories was 90.7%, which indicates good performance. If a sentiment classification system with a large capacity is prepared using the proposed method, then it is expected that sentiment analysis in various fields will be possible, such as for determining social phenomena through SNS.
In recent times, studies sentiment analysis are being actively conducted by implementing natural language processing technologies for analyzing subjective data such as opinions and attitudes of users expressed on the Web, blogs, and social networking services (SNSs). Conventionally, to classify the sentiments in texts, most studies determine positive/negative/neutral sentiments by assigning polarity values for sentiment vocabulary using sentiment lexicons. However, in this study, sentiments are classified based on Thayer's model, which is psychologically defined, unlike the polarity classification used in opinion mining. In this paper, as a method for classifying the sentiments, sentiment categories are proposed by extracting sentiment keywords for major sentiments by using hashtags, which are essential elements of Instagram. By applying sentiment categories to user posts, sentiments can be determined through the similarity measurement between the sentiment adjective candidates and the sentiment keywords. The test results of the proposed method show that the average accuracy rate for all the sentiment categories was 90.7%, which indicates good performance. If a sentiment classification system with a large capacity is prepared using the proposed method, then it is expected that sentiment analysis in various fields will be possible, such as for determining social phenomena through SNS.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
[7]에서는 심리학적 감정들을 기반으로 트위터의 텍스트를 분석하여 정의한 감정 정보 프레임을 추출한 후 기본적으로 정의해놓은 감성을 수정하는 방법을 제안하여 감성의 극성뿐만 아니라 긍정과 부정의 근거가 되는 감성을 재구성함으로써 긍정 9가지, 부정 10가지, 중립 4가지의 감성으로 분류하였다.기존의 감정 분류 방법은 SNS 의 텍스트 데이터를 활용한 방법이었으나, 본 논문에서는 Thayer의 감정 모델을 기반으로 인스타그램의 해시태그를 이용하여 사용자의 감정을 분류하고자 한다.
또한 [10]의 연구에서는 해시태그 기능이 소셜 네트워크 상승의 중요한 역할로 작용함을 언급하였으며 인스타그램에서나이브 베이즈 분류기(NaiveBayesclassifier)를 사용하여 해시태그의 감정 분류를 시도하였다. 따라서본 논문에서는 이러한 해시태그의 특징을 활용하여 감정 카테고리를 제안하고자 한다.
이러한 SNS의 확산은 개인의 관심사와 관련된 사용 자간의 정보공유를 가능하게 함으로써 사용자가 게시한 게시물 등을 이용하여 관심사나 감정을 분석을 위한 연구[3, 4, 5]가 수행되고 있으나, 대부분 기존의보편화된 SNS를 활용한 연구에 미치고 있다. 따라서본 연구에서는 3세대 SNS중 하나인 인스타그램을 대상으로 사용자의 감정분류를 수행하고자 한다. 인스타그램은 사용자가 공유하고 싶은 이미지를 스마트 디바이스를 통해 촬영하거나 기존에 촬영한 이미지를 업로드 할 때 간단한 해시태그(Hashtag)를 덧붙여 글을 게시함으로써 자신의 감정을 표현하고 다른 사용자들과 교류할 수 있는 대표적인 3세대 SNS 이다.
본 논문에서는 인스타그램에서 심리학적 감정 분류 체계 이론 중 하나인 Thayer의 감정 모델을 기반으로 해시태그를 이용하여 감정을 분류한 뒤 사용자가 작성한 게시글에 분류한 감정 카테고리를 적용하여 감정을 분석하는 방법을 제안한다. Fig.
인스타그램은 사용자가 공유하고 싶은 이미지를 스마트 디바이스를 통해 촬영하거나 기존에 촬영한 이미지를 업로드 할 때 간단한 해시태그(Hashtag)를 덧붙여 글을 게시함으로써 자신의 감정을 표현하고 다른 사용자들과 교류할 수 있는 대표적인 3세대 SNS 이다.본 논문에서는 인스타그램을 대상으로 오피니언 마이닝에서 활용하고 있는 극성 분류와는 달리 심리학적으로 정의된 감정을 기준으로 감정을 분류하였고, 실제 인스타그램에서 사용되는 감정을 분석하기 위해 인스타그램의 해시태그를 이용하여 감정 카테고리를 제안하였다.기존 감정 분석에 대한 연구의 경우 텍스트의 감정을 분류하기 위해 감정 사전을 이용하여 감정어휘에 대한 극성 값을 부여해 긍/부정을 판별하여 감성을 판단하였으나 제안하는 감정 카테고리를 통해 사용자의 주요 감정을 분석할 수 있어 주관적인 감정에 대한 모호함을 해결할 수 있다.
준다[12].본 연구에서는 감정 분류의 정확성 향상과 오분류율을 최소화하기 위해 Thayer의 대표 4가지 감정인 Happy, Angry, Peaceful, Sad를 카테고리로 선정하여 분류 기준을 세우고, 이를 감정 형용사라고 표현하였다.카테고리의 선정이 끝나면 인스타그램에서 정의된 감정 형용사가 포함된 해시태그 데이터를 수집하는데 그 과정은 다음과 같다.
본 절에서는 Fig.3을 예로 들어 앞서 제안한 해시태그 기반 감정 카테고리를 인스타그램 사용자 게시물에 적용하여 감정을 분석하는 방법에 대해 기술한다. 먼저 감정을 분석하기 위한 대상으로는 게시물 하나를 기준으로 두었을 때, 게시물에 있는 게시 글과 댓글의 정보를 통해 사용자의 감정을 파악할 수 있다는 것을 전제로 인스타그램의 사용자 게시물에서 객관적 판단이 가능한 게시글 자료인 텍스트 정보만을 수집하여 사용한다.
이때 해시태그는 게시물의 주제를 담는 키워드가 될 수 있으며 자신의 기분이나 상태를 공유하는 감정을 담는 키워드가 될 수 있다.본 절에서는 해시태그를 이용하여 인스타그램 내에서 사용자들이 자주 공유하는 감정들을 분류하는 방법에 대해 기술한다.감정을 분류하기 위해 카테고리를 선정하여 기준을 세우고, 선정된 각각의 대표 카테고리를 감정 형용사로 표현하여 감정 형용사가 포함된 해시태그 데이터를 수집한다.
제안 방법
인스타그램의 API를 사용하기 위해 필요한 access_token을 받기 위해 인스타그램 개발자 페이지[13]에서 인증 절차를 거친다.API를 이용하여 감정 형용사를 포함하고 있는 게시물 정보에서 해시태그만을 수집한다. 이때 수집한 해시태그는 각 감정 형용사 한 개 당 10, 000건의 게시물의 해시태그를 무작위로 추출하였고, 총 40, 000건의 게시물의 해시태그를 수집하였다.
전처리 과정을 거쳐 추출된 형용사 리스트에서 감정 키워드를 추출하기 위해서는 먼저 단어들의 빈도수(TermFrequency)를 측정하여 빈도수가 높은 순으로 내림차순 정렬해 감정 키워드를 선정한다.감정 키워드의 선정은 주요 감정과 동시 출현하는 빈도수의 횟수를 기준으로 수집한 데이터 개수의 0.01%이상인 빈도수를 갖는 경우를 감정 키워드로 선정하였으며, 감정 형용사와 해당 감정 키워드 리스트의 각각의 단어가 일치하는 경우는 배제시켰다. Table1은 제안하는 감정 형용사에 따른 해시태그 기반의 감정 카테고리를 나타낸다.
본 절에서는 해시태그를 이용하여 인스타그램 내에서 사용자들이 자주 공유하는 감정들을 분류하는 방법에 대해 기술한다.감정을 분류하기 위해 카테고리를 선정하여 기준을 세우고, 선정된 각각의 대표 카테고리를 감정 형용사로 표현하여 감정 형용사가 포함된 해시태그 데이터를 수집한다.카테고리의 선정에 사용된 자료는 심리학적으로 정의된 Thayer의 감정 분류 체계[11]로 Fig.
즉, 기존의 오피니언 마이닝에서 활용하고 있는 극성 분류와는 달리 심리학적으로 정의된 Thayer의 모델을 바탕으로 실제 인스타그램에서 공유되는 감정을 적용하기 위하여 인스타그램의 핵심적인 요소인 해시태그를 이용하여 주요 감정에 대한 세부적인 감정 키워드를 분류함으로써 인스타그램에서 주로 공유되는 감정을 파악할 수 있다. 다음 절에서는 감정 키워드를 핵심 단서로 이용하여 사용자의 감정을 분석하는 방법에 대해 다룬다.
또한 각각의 게시물에 대한시간 정보로 판단하였을 때에도 최근 게시물과 과거의 게시물에 담긴 감정이 지속되지 않기 때문이다. 따라서 각 하나의 게시물에 해당하는 주요 감정을 분석하기로 한다.먼저, 사용자의 게시글을 추출하는 과정은 앞서 감정 형용사가 포함된 해시태그를 추출하는 과정과 유사하며, 사용자의 게시물을 추출하기 위해서는 userId값의 고유번호가 필요하다.
3을 예로 들어 앞서 제안한 해시태그 기반 감정 카테고리를 인스타그램 사용자 게시물에 적용하여 감정을 분석하는 방법에 대해 기술한다. 먼저 감정을 분석하기 위한 대상으로는 게시물 하나를 기준으로 두었을 때, 게시물에 있는 게시 글과 댓글의 정보를 통해 사용자의 감정을 파악할 수 있다는 것을 전제로 인스타그램의 사용자 게시물에서 객관적 판단이 가능한 게시글 자료인 텍스트 정보만을 수집하여 사용한다.분석하는 기준은 사용자가 올린 게시물 하나를 기준으로 한다.
본연구에서는 수집한 해시태그 데이터를 효과적으로 적용하기 위해 파이썬(Python)의 자연어 처리 라이브러리인 NLTK(NaturalLanguageToolkit)[14] 를이용한다.먼저 전처리 과정의 첫 단계로 문장 내에서 단어별로 토큰화 한 뒤 숫자와 기호를 제거하는 불용어 삭제 단계와 POS(PartofSpeech)태깅 단계를 통하여 품사를 파악한다.전처리 과정을 거친 해시태그 중에서 태그가 JJ인 즉, 형용사의 품사를 가진 단어들만을 추출한다.
3장에서는 인스타그램을 대상으로 사용자 감정 분류와 분석의 방법에 대해 기술한다.본 논문에서 제안하는 사용자 감정분석의 방법으로는 크게 해시태그를 이용한 감정 분류 방법과 제안한 해시태그 기반 감정 카테고리를 사용자의 게시물에 적용하여 감정을 분석하는 방법에 대해 제시한다.4장에서는 제안한 감정 카테고리에 대한 정확성을 측정하여 성능을 평가하고, 마지막으로 결론 및 향후 연구를 5장에서 제시한다.
본 논문에서는 인스타그램의 핵심적 요소인 해시태그를 이용하여 감정을 분류하여 주요 감정에 대한감정 키워드를 추출하여 감정 카테고리를 제시하였고, 이를 사용자 게시물에 적용하여 게시글의 감정 형용사 후보와 감정 카테고리의 감정 키워드와의 유사도 측정을 통해 감정을 분석하는 방법을 제안하였다. 제안하는 방법의 특징으로는 오피니언 마이닝에서 활용하고 있는 극성 분류와는 달리 심리학적으로 정의된 Thayer의 모델을 기준으로 감정을 분류하였고 해시태그를 이용하여 감정 카테고리를 제안함으로써 실제 인스타그램에서 공유되는 감정을 적용하였다는 점이 있다.
3의 사용자 게시글에서는 감정 형용사 후보로 “happy, cute, adorable, beautiful, good'이 추출된다.이를 제안한 해시태그 기반의 각각의 감정 카테고리와의 유사도 측정을 통해 나온 수치 중 최댓값을 가지는 감정 카테고리로써 사용자의 감정을 분석한다.유사도란 두 개체의 유사한 정도를 수치적으로 측정할 수 있는 척도를 말한다.
이때, 형용사의 품사를 가지고 있는 JJR과 JJS도 함께 이용하여 태깅의 정확도를 높이기로 한다.전처리 과정을 거쳐 추출된 형용사 리스트에서 감정 키워드를 추출하기 위해서는 먼저 단어들의 빈도수(TermFrequency)를 측정하여 빈도수가 높은 순으로 내림차순 정렬해 감정 키워드를 선정한다.감정 키워드의 선정은 주요 감정과 동시 출현하는 빈도수의 횟수를 기준으로 수집한 데이터 개수의 0.
전처리 과정을 거친 사용자의 게시글에서 감정 형용사 후보를 추출하기 위해 형용사 품사를 가진 단어들을 대상으로 빈도수(TermFrequency)를 측정하여 높은 순으로 내림차순 정렬한 뒤 선정된 감정 형용사 후보를 추출한다.이때 분석하고자 하는 대상이 게시물 한 개이기 때문에, 빈도수에 따라 상위 5개까지를 감정 형용사 후보로 정의한다.
정확률은 제안한 감정 카테고리를 이용하여 분류한 결과의 정확성을 평가하는 것이며 본 논문에서는 제시한 감정 카테고리에 의해 분류된 게시물의 수중 감정 카테고리에 의해 올바르게 분류된 게시물의 수로 Precision을 판단하였다.제안하는 해시태그 기반 감정 카테고리의 성능을 식 (2)의 정확률을 이용하여 평가한 결과를 Fig.
정확성 평가는 각 감정 카테고리별 정확률과 감정 카테고리에 대한 정답률을 평균화하여 도출하였다. 전체적으로 분류된 결과는 평균 90.
제안하였다. 제안하는 방법의 특징으로는 오피니언 마이닝에서 활용하고 있는 극성 분류와는 달리 심리학적으로 정의된 Thayer의 모델을 기준으로 감정을 분류하였고 해시태그를 이용하여 감정 카테고리를 제안함으로써 실제 인스타그램에서 공유되는 감정을 적용하였다는 점이 있다.제안 방법에 대한 실험 결과 전체감정 카테고리에 대한 평균 정확률은 90.
대상 데이터
본 논문에서 실험에 사용된 인스타그램의 게시물은 Happy, Angry, Peaceful, Sad네 개의 범주를 대상으로 제안한 감정 카테고리의 정확률 계산을 위해각 카테고리 당 게시물 250건씩 수집한 게시물에 순차적으로 번호를 부여하여 총 1, 000건의 실험 데이터셋을 구축하였다.본 논문의 실험은 제안한 분류 방법인 해시태그 기반 감정 카테고리에 대한 효율성을 평가하기 위해 정확률(Precision)을 이용하였으며, 식 (2)와 같이 계산된다.
API를 이용하여 감정 형용사를 포함하고 있는 게시물 정보에서 해시태그만을 수집한다. 이때 수집한 해시태그는 각 감정 형용사 한 개 당 10, 000건의 게시물의 해시태그를 무작위로 추출하였고, 총 40, 000건의 게시물의 해시태그를 수집하였다. 이를 감정 형용사가 포함된 해시태그의 감정 키워드를 추출하기 위해서는 전처리 과정이 필요하다.
데이터처리
구축하였다.본 논문의 실험은 제안한 분류 방법인 해시태그 기반 감정 카테고리에 대한 효율성을 평가하기 위해 정확률(Precision)을 이용하였으며, 식 (2)와 같이 계산된다.
이론/모형
이를 감정 형용사가 포함된 해시태그의 감정 키워드를 추출하기 위해서는 전처리 과정이 필요하다. 본연구에서는 수집한 해시태그 데이터를 효과적으로 적용하기 위해 파이썬(Python)의 자연어 처리 라이브러리인 NLTK(NaturalLanguageToolkit)[14] 를이용한다.먼저 전처리 과정의 첫 단계로 문장 내에서 단어별로 토큰화 한 뒤 숫자와 기호를 제거하는 불용어 삭제 단계와 POS(PartofSpeech)태깅 단계를 통하여 품사를 파악한다.
본 연구에서 사용자의 감정을 분석하기 위해 유사도를 측정하기 위한 이유는 분석하고자 하는 사용자 게시글에서 추출한 감정 형용사 후보를 해시태그 기반으로 분류해놓은 감정 카테고리와 서로 어느 정도 유사하는지를 측정할 수 있는 기준이 필요하기 때문이다.유사도 값을 측정하는 방법으로 코사인 유사도(CosineSimilarity)를 이용하였다. 코사인 유사도는 유사도 측정을 위한 대표적인 척도이며[15] 데이터 마이닝 분야에서 문서간의 유사도를 측정할 때 자주 사용된다.
성능/효과
7%로 좋은 성능을 보였다.Angry카테고리에서는 93.2%로 가장 높은 정확률을 보여주었고, Happy 카테고리는 92.8%, Sad카테고리는 90.4%, Peaceful카테고리는 86.4%순으로 분석되었다.본 연구는 감정 분류의 정확성 향상과 오분류율을 최소화하기 위해 대표 감정으로 Happy, Angry, Peaceful, Sad를 카테고리로 선정하여 감정 카테고리를 제시하였으나 향후에는 4가지 감정 외에 분류될 수 있는 감정을 추가로 선정하여 확장한다면 사용자의 감정을 보다 세밀하게 분석할 수 있는 연구가 될 것이라 생각된다.
7%의 정확성을 보여 제안한 감정 카테고리의 효율성을 입증하기에 만족할만한 결과를 보여주었다.각 감정 카테고리별 결과에서는 Angry카테고리가 가장 높은 정확률을 보였고, Happy카테고리가 두 번째를 이은 것으로 보아 감정의 극성이 뚜렷할수록 높은 정확성을 보인다는 것을 알 수 있었다.각각의 감정 카테고리들의 오 분류된 결과를 분석해 본 결과 Happy 카테고리에서 올바르지 않게 분류된 정보는 대부분 Peaceful 카테고리에 해당되었으며, Peaceful카테고리에서 올바르지 않게 분류된 정보는 대부분 Happy 카테고리에 해당하였다.
각 감정 카테고리별 결과에서는 Angry카테고리가 가장 높은 정확률을 보였고, Happy카테고리가 두 번째를 이은 것으로 보아 감정의 극성이 뚜렷할수록 높은 정확성을 보인다는 것을 알 수 있었다.각각의 감정 카테고리들의 오 분류된 결과를 분석해 본 결과 Happy 카테고리에서 올바르지 않게 분류된 정보는 대부분 Peaceful 카테고리에 해당되었으며, Peaceful카테고리에서 올바르지 않게 분류된 정보는 대부분 Happy 카테고리에 해당하였다.이를 통해 두 감정 카테고리가 어느 정도 상관관계가 있다는 것을 알 수 있었다.
이를 통해 두 감정 카테고리가 어느 정도 상관관계가 있다는 것을 알 수 있었다.그 중 Peaceful카테고리에서 Happy카테고리로 오 분류된 정보에서는 Happy카테고리의 감정 키워드인 'good' 이라는 키워드가 크게 영향을 미친 것으로 분석되었다. Angry와 Sad카테고리에서는 오분류된 결과를 분석한 결과 두 카테고리가 대부분 Happy 카테고리에 해당되었다.
본 논문에서는 인스타그램을 대상으로 오피니언 마이닝에서 활용하고 있는 극성 분류와는 달리 심리학적으로 정의된 감정을 기준으로 감정을 분류하였고, 실제 인스타그램에서 사용되는 감정을 분석하기 위해 인스타그램의 해시태그를 이용하여 감정 카테고리를 제안하였다.기존 감정 분석에 대한 연구의 경우 텍스트의 감정을 분류하기 위해 감정 사전을 이용하여 감정어휘에 대한 극성 값을 부여해 긍/부정을 판별하여 감성을 판단하였으나 제안하는 감정 카테고리를 통해 사용자의 주요 감정을 분석할 수 있어 주관적인 감정에 대한 모호함을 해결할 수 있다. 본 논문의 구성은 다음과 같다.
본 논문에서는 코사인 유사도가 문서나 텍스트에 적용될 경우 식 (1)의 벡터 A, B로 해당 텍스트의 단어 출현 빈도가 사용되는 특징을 가지고 있어 제안하는 감정 카테고리에 있는 감정 키워드와 추출된 감정 형용사 후보 각각의 단어 출현 빈도인 벡터 A, 벡터 B로 간주하여 유사도를 측정하기에 적합하다고 판단하였다.따라서 식 (1)을 통하여 유사도의 값을 측정하고, 각각의 감정 카테고리의 감정 키워드와 유사도를 비교 측정하여 가장 높이 측정된 값을 최종적으로 사용자 게시물의 감정으로 판단하기로 한다.
[9]의 연구는 트위터 상에서 감성 분석을 하는데 있어서 그래프 모델을 기반으로 해시태그 감성 분류 접근법을 제시하였다.이때 해시태그의 유형을 주제에 대해 주관적인 의견을 표현하는 감정 해시태그, 주제와 관련된 주제 해시태그, 표현하려는 대상과 감정이 함께 나타난 감정 주체 해시태그로 세 가지 범주로 정의하여 그래프 모델이 나타나는 동시 발생된 관계를 통해 감정의 극성을 결정하였고, 해시태그가 감성 분석의 중요한 요소로 작용한다는 것을 실험적으로 증명하였다.또한 [10]의 연구에서는 해시태그 기능이 소셜 네트워크 상승의 중요한 역할로 작용함을 언급하였으며 인스타그램에서나이브 베이즈 분류기(NaiveBayesclassifier)를 사용하여 해시태그의 감정 분류를 시도하였다.
일반적인 문서 검색의 응용으로 문서간의 유사도를 구하기 위해 해당 문서를 분석하여 추출한 다수의 단어를 바탕으로 사전에 생성된 색인어와 유사도를 측정한다.이에 본 논문에서는 인스타그램 내에서 사용되는 해시태그를 이용하여 제시한 감정 카테고리의 감정 키워드와 실제 인스타그램 사용자 게시글의 감정 형용사 후보 간의 유사도를 측정함으로써 감정 카테고리의 감정 키워드를 색인어로 사용하여 비교 대상이 적합하다고 판단되며, 감정 어휘를 나타내는 형용사 품사의 출현 빈도를 속성 값으로 측정한 유사도를 통해 해당 게시물의 사용자 감정을 판단할 수 있어 주관적인 감정에 대한 모호함을 객관적으로 해결할 수 있다.
도출하였다. 전체적으로 분류된 결과는 평균 90.7%의 정확성을 보여 제안한 감정 카테고리의 효율성을 입증하기에 만족할만한 결과를 보여주었다.각 감정 카테고리별 결과에서는 Angry카테고리가 가장 높은 정확률을 보였고, Happy카테고리가 두 번째를 이은 것으로 보아 감정의 극성이 뚜렷할수록 높은 정확성을 보인다는 것을 알 수 있었다.
제안하는 방법의 특징으로는 오피니언 마이닝에서 활용하고 있는 극성 분류와는 달리 심리학적으로 정의된 Thayer의 모델을 기준으로 감정을 분류하였고 해시태그를 이용하여 감정 카테고리를 제안함으로써 실제 인스타그램에서 공유되는 감정을 적용하였다는 점이 있다.제안 방법에 대한 실험 결과 전체감정 카테고리에 대한 평균 정확률은 90.7%로 좋은 성능을 보였다.Angry카테고리에서는 93.
볼 수 있다.즉, 기존의 오피니언 마이닝에서 활용하고 있는 극성 분류와는 달리 심리학적으로 정의된 Thayer의 모델을 바탕으로 실제 인스타그램에서 공유되는 감정을 적용하기 위하여 인스타그램의 핵심적인 요소인 해시태그를 이용하여 주요 감정에 대한 세부적인 감정 키워드를 분류함으로써 인스타그램에서 주로 공유되는 감정을 파악할 수 있다. 다음 절에서는 감정 키워드를 핵심 단서로 이용하여 사용자의 감정을 분석하는 방법에 대해 다룬다.
후속연구
본 논문의 향후 연구 방향으로는 감정 카테고리의 감정 키워드를 선정함에 있어 영향을 많이 미치는 키워드들에 대한 오분류율을 줄이는 연구가 필요하다.또한 본연구는 텍스트를 이용하여 추출한 감정 형용사만을 가지고 연구하였으나, 감정을 표현할 수 있는 이모티콘이나 감정을 품고 있는 다른 품사를 활용하는 방법 등의 확장된 연구로 이어져야 할 것이다. 제안하는방법을 통해 대용량의 감정 분류 체계가 갖춰진다면 SNS를 통한 주요 이슈나 사회적 현상 등 다양한 분야에 대한 감정 분석이 가능할 것으로 기대되며 나아가 SNS상에서 사용자 맞춤형 서비스나 추천 서비스 또는 감성마케팅 등으로 활용될 것으로 기대된다.
본 연구는 감정 분류의 정확성 향상과 오분류율을 최소화하기 위해 대표 감정으로 Happy, Angry, Peaceful, Sad를 카테고리로 선정하여 감정 카테고리를 제시하였으나 향후에는 4가지 감정 외에 분류될 수 있는 감정을 추가로 선정하여 확장한다면 사용자의 감정을 보다 세밀하게 분석할 수 있는 연구가 될 것이라 생각된다.본 논문의 향후 연구 방향으로는 감정 카테고리의 감정 키워드를 선정함에 있어 영향을 많이 미치는 키워드들에 대한 오분류율을 줄이는 연구가 필요하다.또한 본연구는 텍스트를 이용하여 추출한 감정 형용사만을 가지고 연구하였으나, 감정을 표현할 수 있는 이모티콘이나 감정을 품고 있는 다른 품사를 활용하는 방법 등의 확장된 연구로 이어져야 할 것이다.
4%순으로 분석되었다.본 연구는 감정 분류의 정확성 향상과 오분류율을 최소화하기 위해 대표 감정으로 Happy, Angry, Peaceful, Sad를 카테고리로 선정하여 감정 카테고리를 제시하였으나 향후에는 4가지 감정 외에 분류될 수 있는 감정을 추가로 선정하여 확장한다면 사용자의 감정을 보다 세밀하게 분석할 수 있는 연구가 될 것이라 생각된다.본 논문의 향후 연구 방향으로는 감정 카테고리의 감정 키워드를 선정함에 있어 영향을 많이 미치는 키워드들에 대한 오분류율을 줄이는 연구가 필요하다.
이 두 감정 카테고리에서 오 분류된 정보들은 대부분 사랑과 관련된 슬픈 글귀나 슬픈노래가사 등에 자주 등장하는 지나간 사랑의 그리움, 아름다운 추억을 표현하는 ‘beautiful'과 ’good'이라는 키워드가 크게 영향을 미친 것으로 작용하였다. 이러한 점들을 극복하기 위해서는 향후에는 제안하는 감정 카테고리의 감정 키워드를 선정하는 데 있어 ‘good'이나 ’beautiful'과 같이 영향을 많이 미치는 키워드들에 대한 가중치를 부여하거나 더욱 세부적인 기준을 두어 오분류 사례를 줄이는 연구가 필요할 것으로 판단된다.
또한 본연구는 텍스트를 이용하여 추출한 감정 형용사만을 가지고 연구하였으나, 감정을 표현할 수 있는 이모티콘이나 감정을 품고 있는 다른 품사를 활용하는 방법 등의 확장된 연구로 이어져야 할 것이다. 제안하는방법을 통해 대용량의 감정 분류 체계가 갖춰진다면 SNS를 통한 주요 이슈나 사회적 현상 등 다양한 분야에 대한 감정 분석이 가능할 것으로 기대되며 나아가 SNS상에서 사용자 맞춤형 서비스나 추천 서비스 또는 감성마케팅 등으로 활용될 것으로 기대된다.
참고문헌 (15)
GlobalWebIndex, GWI Social Summary, 2014.
B.S. Park, “Global SNS Present Condition and Implications,” Korea Information Society, Development Institute, Information & Communications policy, Vol. 26, No. 2, pp. 22-34, 2014.
M.J. Nam, J.I. Kim, and J.H. Shin, “A User Emotion Information Measurement using Image and Text on Instagram-Based,” Journal of Korea Multimedia Society, Vol. 17, No. 9, pp. 1125-1133, 2014.
J.I. Kim, D.J. Choi, B.K. Ko, E.J. Lee, and P.K. Kim, “Extracting User Interests on Facebook,” International Journal of Distributed Sensor Networks, Vol. 2014, Article ID 146967, pp. 1-5, 2014.
C.H. Lee, D.H. Choi, S.S. Kim, and S.W. Kang, "Classification and Analysis of Emotion in Korean Microblog Texts,” Journal of Korean Institute of information Scientists and Engineers : Databases, Vol. 40, No. 3, pp. 159-167, 2013.
D.Y. Kim, Y. Wu, and H.R. Park, “Constructing an Evaluation Set for Korean Sentiment Analysis Systems Incorporating the Category and the Strength of Sentiment,” The Journal of the Korea Contents Association, Vol. 12, No. 11, pp. 30-38, 2012.
M.S. Chang, “Empirical Sentiment Classification using Psychological Emotions and Social Web Data,” Journal of Korean Institute of Intelligent Systems, Vol. 22, No. 5, pp. 563-569, 2012.
K.D. Rosa, R. Shah, B. Lin, A. Gershman, and R. Frederking, "Topical Clustering of Tweets," Proceeding of the ACM SIGIR : SWSM, pp. 1-8, 2011.
X. Wang, F. Wei, X. Liu, M. Zhou, and M. Zhang, "Topic Sentiment Analysis in Twitter : A Graph-based Hashtag Sentiment Classification Approach," Proceedings of the 20th ACM International Conference on Information and Knowledge Management, pp. 1031-1040, 2011.
N. Gunawardena, J. Plumb, N. Xiao, and H. Zhang, Instagram Hashtag Sentiment Analysis, University of Utah, Utah, 2013.
R. Thayer, The Biopsychology of Mood and Arousal, Oxford University Press, New York, 1989.
H.S. Lee, A Thesis on Apply Emotion to Location-Based Service, Master's Thesis of KonKuk University, 2013.
Instagram Developer Documentation(2013), https://instagram.com/developer/ (accessed April, 1. 2015).
Natural Language Toolkik(2009), https://www.nltk.org/ (accessed April, 1. 2015).
E.J. Kwon, J.W. Kim, N.J. Heo, and S.G. Kang, "Personalized Recommendation System using Level of Cosine Similarity of Emotion Word from Social Network," Journal of Information Technology and Architecture, Vol. 9, No. 3, pp. 333-344, 2012.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.