기존의 감정분석을 통한 극성 분류는 주로 평점을 기반으로 하는 상품평을 기준으로 문장규칙을 이용하여 분석해왔다. 이러한 분석방법은 평점이 없는 블로그 같은 경우 적용되기 어려움 점이 있고 댓글 아르바이트나 관리자에 의해 상품평이 조작될 가능성이 있어서 상품평 만으로는 상품, 매장에 대한 의견을 파악하기에는 어려움이 있다. 이러한 문제점을 고려할 때 개인들의 솔직한 의견이 담겨 있는 블로그를 분석하여 극성을 분류하면 상품, 매장에 대한 올바른 이해가 가능하다. 본 논문은 도메인별로 블로그 글에 대한 고빈도 단어를 추출하여 주제어를 선정하고, 선정된 주제어를 기준으로 제안하는 감정분석 기법을 적용하여 블로그 글에 대한 극성을 분류한다. 감정분석 기법의 성능을 평가하기 위하여 정보 검색 분야에서 사용되는 측정지표 Precision, Recall, F-score를 사용하여 본 연구의 극성 분류기법의 유용성을 검증한다. 평가 결과 기존의 상품평을 문장규칙을 이용하여 분석하여 극성 분류를 하는 기법들에 비해서 제안한 감정분석 기법을 적용할 경우에 우수한 성능으로 극성 분류를 하는 것으로 나타났다.
기존의 감정분석을 통한 극성 분류는 주로 평점을 기반으로 하는 상품평을 기준으로 문장규칙을 이용하여 분석해왔다. 이러한 분석방법은 평점이 없는 블로그 같은 경우 적용되기 어려움 점이 있고 댓글 아르바이트나 관리자에 의해 상품평이 조작될 가능성이 있어서 상품평 만으로는 상품, 매장에 대한 의견을 파악하기에는 어려움이 있다. 이러한 문제점을 고려할 때 개인들의 솔직한 의견이 담겨 있는 블로그를 분석하여 극성을 분류하면 상품, 매장에 대한 올바른 이해가 가능하다. 본 논문은 도메인별로 블로그 글에 대한 고빈도 단어를 추출하여 주제어를 선정하고, 선정된 주제어를 기준으로 제안하는 감정분석 기법을 적용하여 블로그 글에 대한 극성을 분류한다. 감정분석 기법의 성능을 평가하기 위하여 정보 검색 분야에서 사용되는 측정지표 Precision, Recall, F-score를 사용하여 본 연구의 극성 분류기법의 유용성을 검증한다. 평가 결과 기존의 상품평을 문장규칙을 이용하여 분석하여 극성 분류를 하는 기법들에 비해서 제안한 감정분석 기법을 적용할 경우에 우수한 성능으로 극성 분류를 하는 것으로 나타났다.
Previous polarity classification using sentiment analysis utilizes a sentence rule by product reviews based rating points. It is difficult to be applied to blogs which have not rating of product reviews and is possible to fabricate product reviews by comment part-timers and managers who use web site...
Previous polarity classification using sentiment analysis utilizes a sentence rule by product reviews based rating points. It is difficult to be applied to blogs which have not rating of product reviews and is possible to fabricate product reviews by comment part-timers and managers who use web site so it is not easy to understand a product and store reviews which are reliability. Considering to these problems, if we analyze blogs which have personal and frank opinions and classify polarity, it is possible to understand rightly opinions for the product, store. This paper suggests that we extract high frequency vocabularies in blogs by several domains and choose topic words. Then we apply a technique of sentiment analysis and classify polarity about contents of blogs. To evaluate performances of sentiment analysis, we utilize the measurement index that use Precision, Recall, F-Score in an information retrieval field. In a result of evaluation, using suggested sentiment analysis is the better performances to classify polarity than previous techniques of using the sentence rule based product reviews.
Previous polarity classification using sentiment analysis utilizes a sentence rule by product reviews based rating points. It is difficult to be applied to blogs which have not rating of product reviews and is possible to fabricate product reviews by comment part-timers and managers who use web site so it is not easy to understand a product and store reviews which are reliability. Considering to these problems, if we analyze blogs which have personal and frank opinions and classify polarity, it is possible to understand rightly opinions for the product, store. This paper suggests that we extract high frequency vocabularies in blogs by several domains and choose topic words. Then we apply a technique of sentiment analysis and classify polarity about contents of blogs. To evaluate performances of sentiment analysis, we utilize the measurement index that use Precision, Recall, F-Score in an information retrieval field. In a result of evaluation, using suggested sentiment analysis is the better performances to classify polarity than previous techniques of using the sentence rule based product reviews.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
이러한 문장의 규칙에 맞게 본 논문에서는 부사가 들어가서 관형어를 꾸며주면서 문장 길이가 길어지면 감정의 깊이를 나타낸다고 볼 수 있다. 따라서 이 알고리즘에서 부사가중치와 거리가중치를 두어 극성 분류이외에도 극성의 강도를 파악할 수 있도록 하였다.
또한 [1]에서는 문장규칙을 적용할 때 관형사 규칙만을 적용하여 의미적 강도를 파악하기 어려운 점이 있다. 본 논문에서는 평점이 없는 글에서도 극성분석을 통해 긍정인 감정이 담겨 있는 글과 부정적인 글을 분류할 수 있는 방법을 연구한다. [2]는 문장 간의 거리에 가중치를 두어 의미의 강도를 파악하여 적용하였다.
본 연구는 오피니언 마이닝에서 자주 사용하는 평점이 매겨져 있는 상품평 이외에 상품, 매장에 대한 의견이 담겨 있는 블로그의 글을 대상으로 활용할 수 있는 감정분석 알고리즘을 제안한다. 제안방법은 먼저 수집된 블로그 글의 형태소를 분석하여 명사추출 후, 빈도를 세서 주제어를 선정한다.
제안 방법
감정사전의 구축은 동양권에서 감정을 설명할 때 가장 많이 인용되는 ‘희로애락(喜怒哀樂)’을 기준 ‘기쁨, 분노, 슬픔, 즐거움’의 동의어로 감정사전 데이터베이스를 구축하였다.
[11],[12],[13],[14]가 연구하였다. 그 중 [2]는 문장 간의 거리에 따른 의미적 강도를 연구하였는데 이 부분을 한글에 맞게 변형하여 본 논문의 감정분석 기법에 적용하였다.
본 연구에서 실험은 부사규칙만 적용하였을 때의 실험, 거리규칙만 적용하였을 때의 실험, 둘 다 적용한 본 연구의 분류기법을 사용한 실험 3가지로 진행하였고 기존 연구 [1],[2]의 실험과 비교하였다. 도메인 음식점은 3가지 실험을 모두 진행하였고 영화, 핸드폰은 제안하는 분류 기법만을 적용하여 실험하였다.
불필요한 글을 제거하기 위해 첫 번째 단계로 글의 제목에 선정된 도메인 관련 키워드가 있을 경우에 필요한 글로 간주하여 추출한다. 두 번째 단계는 Jsoup API를 이용하여 http 파싱을 하여 평가가 있는 글만을 수집한다. 필터링 결과 14만개의 데이터 중 5619개의 데이터를 선별할 수 있었다.
본 논문에서 제안하는 감정분석 알고리즘의경우, 기본적으로 평점으로 감정방향이 결정되지 않는 블로그의 일반적인 글을 대상으로 하여 관 형사, 부정, 부사, 거리 규칙을 적용하여 긍정, 부정을 분류하였다. <표 7>은 [1]과 본 분류 기법의 비교 실험의 결과이다.
본 연구에서 실험은 부사규칙만 적용하였을 때의 실험, 거리규칙만 적용하였을 때의 실험, 둘 다 적용한 본 연구의 분류기법을 사용한 실험 3가지로 진행하였고 기존 연구 [1],[2]의 실험과 비교하였다. 도메인 음식점은 3가지 실험을 모두 진행하였고 영화, 핸드폰은 제안하는 분류 기법만을 적용하여 실험하였다.
따라서 이 단어들을 주제어 리스트로 간주하여 다음 단계에서 구축하는 언어문장규칙의 기준점으로 사용한다. 본 연구에서는 초고속 형태소 분석기 mach 1.0[15]을 사용하여 명사 (NN)만을 추출하고, 글마다의 추출된 명사어가 빈도가 얼마나 되는지를 카운트한다. 추출결과는 <표 1>에 나타나있다.
부사규칙은 감정서술어를 꾸며주는 부사어가 문장에 나올 경우 추출하여 가중치를 적용한다. 부사는 서술어의 뜻을 분명하게 만들어주는 품사이기 때문에 본 논문에서는 부사가 감정서술어의 감정의 강도를 깊게 나타낸다고 생각하여 부사에 가중치를 두었다.
Custom Search는 미리 선정한 키워드가 있는 경우, 모두 추출하기 때문에 필요하지 않거나 중요하지 않은 글 또한 추출할 수 있다. 불필요한 글을 제거하기 위해 첫 번째 단계로 글의 제목에 선정된 도메인 관련 키워드가 있을 경우에 필요한 글로 간주하여 추출한다. 두 번째 단계는 Jsoup API를 이용하여 http 파싱을 하여 평가가 있는 글만을 수집한다.
추출된 데이터 안에서 고빈도 단어를 분석하여 주제어를 선정하였다. 선정된 주제어를 기준으로 제안한 문장 규칙(관형사, 부정, 부사, 거리)을 적용하여 극성을 분류하였다. 제안하는 감정분석 알고리즘 안의 세부 규칙인 관형사, 부정, 부사, 거리 규칙의 각각의 성능을 비교 실험을 하였다.
제안방법은 먼저 수집된 블로그 글의 형태소를 분석하여 명사추출 후, 빈도를 세서 주제어를 선정한다. 선정된 주제어를 문장규칙으로 만든 감정 분석 알고리즘을 적용하여 글에 대한 극성을 분류한다. 제안하는 감정 분석 알고리즘에서는 다른 연구에서 주로 사용하는 관형사 규칙 이외에도 부정규칙, 감정의 의미 강도에 따른 깊이를 구분하는 부사규칙과 거리규칙을 사용하여 이전 연구들보다 더 정확하게 분류가 가능하다는 장점을 가지고 있다.
[1]은 도메인의 특징에 따라 감정방향을 상이 하게 사용하는 것을 고려하여 극성을 분류하는 기법이다. 이 기법에서는 평점이 나타나 있는 상품평을 기준으로 서술어의 감정방향을 1차적으로 나누어 놓고 그 뒤에 감정별 서술어의 빈도분석과 극성 비율 값을 계산하여 감정사전을 구축한 후, 서술어에 대한 품사 태깅 규칙을 사용 하여 긍정, 부정을 분류한다. [2]는 상품평을 기준으로 영어로 된 문장을 거리규칙과 부정규칙을 적용하여 극성은 분류한다.
False Positive는 시스템이 부정이라고 분류하였는데 실제로 사람이 확인하였을 때는 긍정인 블로그의 수를 나타낸다. 이를 기반으로 Precision, Recall, 계산하였다.
(그림 2)는 블로그 정보수집 프로세스를 나타낸다. 정보 수집 프로세스의 첫 번째 단계로 Google에서 제공하는 Custom Search API를 이용하여 국내 블로그 서비스 업체인 Naver, Daum, Tistory, Cyworld의 핸드폰, 영화, 음식점 총 3개의 도메인과 관련된 블로그 글을 추출하였다. 영화 도메인에서는 ‘트랜스포머’, 핸드폰 ‘갤럭시S3', 음식점 도메인은 종류별로 10개로 선정하였다.
본 연구는 오피니언 마이닝에서 자주 사용하는 평점이 매겨져 있는 상품평 이외에 상품, 매장에 대한 의견이 담겨 있는 블로그의 글을 대상으로 활용할 수 있는 감정분석 알고리즘을 제안한다. 제안방법은 먼저 수집된 블로그 글의 형태소를 분석하여 명사추출 후, 빈도를 세서 주제어를 선정한다. 선정된 주제어를 문장규칙으로 만든 감정 분석 알고리즘을 적용하여 글에 대한 극성을 분류한다.
본 논문에서 제안하는 감정분석 분류 기법의 프로세스는 (그림 1)과 같다. 제안하는 기법은 기존기준 없이도 감정분석을 통해 긍정, 부정을 판별할 수 있다.
본 연구에서는 기존연구에서 활용하였던 평점이 내포되어 있는 상품평 기반이 아닌 네티즌들의 일반적인인 글이 담겨 있는 블로그를 기준으로 도메인별로 데이터를 수집하였다. 추출된 데이터 안에서 고빈도 단어를 분석하여 주제어를 선정하였다. 선정된 주제어를 기준으로 제안한 문장 규칙(관형사, 부정, 부사, 거리)을 적용하여 극성을 분류하였다.
<표 3>은 도메인별로 추출한 블로그 데이터의 수이다. 테스트 데이터를 도메인별로 200개를 임의로 추출하고 본 논문의 분류기법을 적용하였다.
평가방법은 분류기법을 통해 결정된 감정방향 결과와 실제 수작업으로 감정방향을 확인하였을 때의 결과를 비교하여 일치하는지를 판단하였다. 통계적 분류 평가척도인 식(3) Precision, Recall F-Score를 사용하였다.
[2]는 문장 간의 거리에 가중치를 두어 의미의 강도를 파악하여 적용하였다. 하지만은 이는 영어를 기준으로 하였기 때문에 한글 어순에는 맞지 않는 부분이 있어 본 논문에서 한글 어순에 맞게 거리규칙을 변형하여 적용한다.
대상 데이터
영화 도메인에서는 ‘트랜스포머’, 핸드폰 ‘갤럭시S3', 음식점 도메인은 종류별로 10개로 선정하였다. 각각 1만개, 도합 총 14만개를 추출하였다.
본 연구에서는 Naver, Daum, Tistory, Cyworld 블로그에서 핸드폰, 영화, 그리고 음식점 도메인의 데이터를 수집하였다. <표 3>은 도메인별로 추출한 블로그 데이터의 수이다.
본 연구에서는 기존연구에서 활용하였던 평점이 내포되어 있는 상품평 기반이 아닌 네티즌들의 일반적인인 글이 담겨 있는 블로그를 기준으로 도메인별로 데이터를 수집하였다. 추출된 데이터 안에서 고빈도 단어를 분석하여 주제어를 선정하였다.
영화 도메인에서는 ‘트랜스포머’, 핸드폰 ‘갤럭시S3', 음식점 도메인은 종류별로 10개로 선정하였다.
음식점은 수집된 10가지 음식점 중 5가지 음식점을 임의로 선택하여 실험하였다. 선정된 음식점은 <표 3>에 음식점 세부 도메인으로 구성된다.
두 번째 단계는 Jsoup API를 이용하여 http 파싱을 하여 평가가 있는 글만을 수집한다. 필터링 결과 14만개의 데이터 중 5619개의 데이터를 선별할 수 있었다.
데이터처리
<표 7>은 [1]과 본 분류 기법의 비교 실험의 결과이다. [1]의 논문의 실험 결과 중 긍정, 부정의 글의 비율정보를 미 고려한 데이터를 기준으로 비교하였다. 블로그의 글작성 특성상 도메인 관련 긍정관련 글이 부정 관련 글에 비해 많기 때문이다.
선정된 주제어를 기준으로 제안한 문장 규칙(관형사, 부정, 부사, 거리)을 적용하여 극성을 분류하였다. 제안하는 감정분석 알고리즘 안의 세부 규칙인 관형사, 부정, 부사, 거리 규칙의 각각의 성능을 비교 실험을 하였다.
이론/모형
평가방법은 분류기법을 통해 결정된 감정방향 결과와 실제 수작업으로 감정방향을 확인하였을 때의 결과를 비교하여 일치하는지를 판단하였다. 통계적 분류 평가척도인 식(3) Precision, Recall F-Score를 사용하였다. 식(3)에서 True Positive 는 시스템이 감정방향을 긍정이라고 분류하였는데 실제로 사람이 분류하였을 때 긍정인 블로그의 수이고, False Negative는 시스템이 긍정이라고 분류하였는데 사람이 확인하였을 때 부정인 블로그의 수이다.
성능/효과
관형사, 부정규칙을 사용한 성능과 본 논문에서 제안하는 분류기법을 적용한 성능을 비교한 결과는 <표 6>에 나타냈다. Precision은 1.14% Recall은 4.51%, F-score은 3.8% 향상되었다.
<표 5>는 위의 부사규칙 실험처럼 알고리즘1의 관형사, 부정규칙만을 적용한 성능과 식(2) 거리규칙을 적용하였을 경우의 성능을 비교한 결과이다. Precision은 그대로로 유지되었고 Recall은 약 1.88% 향상, F-score은 0.48%로 향상되었다.
관형사, 부정 규칙을 고려한 성능과 이 기법에 추가적으로 부사규칙을 적용하였을 때의 성능 비교는 성능에 미비하게 저하된 결과가 나타났다. 하지만 거리 규칙을 추가적으로 사용한 기법의 성능은 전 보다는 성능이 향상되었다.
두 가지 비교 실험에서 볼 수 있듯이 제안하는 감정분석 알고리즘이 기존의 연구에서 사용 되는 기법보다 약 10%의 향상된 성능을 나타낸 것으로 볼 때 기존의 분류기법보다 높은 성능을 가진다고 볼 수 있다.
또한 최종적으로 4가지 규칙을 모두 적용한 경우는 관형사, 부정규칙 만을 사용한 결과보다 높게 향상되었다. 또한 기존의 다른 논문에서 연구한 2가지 실험과 비교실험을 하였는데 성능이 각각 8.64%, 12.25%의 높은 향상된 결과를 보여주었다.
하지만 거리 규칙을 추가적으로 사용한 기법의 성능은 전 보다는 성능이 향상되었다. 또한 최종적으로 4가지 규칙을 모두 적용한 경우는 관형사, 부정규칙 만을 사용한 결과보다 높게 향상되었다. 또한 기존의 다른 논문에서 연구한 2가지 실험과 비교실험을 하였는데 성능이 각각 8.
블로그의 글작성 특성상 도메인 관련 긍정관련 글이 부정 관련 글에 비해 많기 때문이다. <표 7>를 보면본 논문의 분류기법이 상품평을 Precision은 15.97%, Recall은 2.91%, F-score는 8.64% 향상된 것을 볼 수 있다.
[2]의 경우 영어를 기준으로 거리 규칙과 부정 규칙을 적용하였기 때문에 한글을 기준으로 하는 본 감정분석 알고리즘의 거리, 부정 규칙과 상이한 점이 있다. <표 8>의 결과를 보면 Precision이 15.92%, Recall이 9.16%, F-Score이 12.25% 향상되었다.
선정된 주제어를 문장규칙으로 만든 감정 분석 알고리즘을 적용하여 글에 대한 극성을 분류한다. 제안하는 감정 분석 알고리즘에서는 다른 연구에서 주로 사용하는 관형사 규칙 이외에도 부정규칙, 감정의 의미 강도에 따른 깊이를 구분하는 부사규칙과 거리규칙을 사용하여 이전 연구들보다 더 정확하게 분류가 가능하다는 장점을 가지고 있다. 또 평점이 없는 글에서도 분류가 가능하기 때문에 제안하는 알고리즘은 더 많은 도메인에서도 활용할 수 있다는 이점이 있다.
관형사, 부정 규칙을 고려한 성능과 이 기법에 추가적으로 부사규칙을 적용하였을 때의 성능 비교는 성능에 미비하게 저하된 결과가 나타났다. 하지만 거리 규칙을 추가적으로 사용한 기법의 성능은 전 보다는 성능이 향상되었다. 또한 최종적으로 4가지 규칙을 모두 적용한 경우는 관형사, 부정규칙 만을 사용한 결과보다 높게 향상되었다.
후속연구
제안하는 감정 분석 알고리즘에서는 다른 연구에서 주로 사용하는 관형사 규칙 이외에도 부정규칙, 감정의 의미 강도에 따른 깊이를 구분하는 부사규칙과 거리규칙을 사용하여 이전 연구들보다 더 정확하게 분류가 가능하다는 장점을 가지고 있다. 또 평점이 없는 글에서도 분류가 가능하기 때문에 제안하는 알고리즘은 더 많은 도메인에서도 활용할 수 있다는 이점이 있다.
극성 분류의 높은 성능 향상을 위해서는 감정사전의 단어들의 긍정, 부정 분류에 대한 정확도를 높일 수 있는 연구가 필요하다. 또한 인터넷 용어나 정확하지 않은 문장, 관용적 표현 등의 규칙을 판단할 수 있는 문장 규칙에 대한 연구가 필요하다.
향후 연구는 감정분석을 통한 극성 분류의 성능을 향상을 위해 감정단어 사전의 연구가 필요하다. 앞서 실험에서 간혹 특정 도메인의 경우 낮은 recall값이 나타났는데 이는 블로그의 특성상 긍정적인 글이 부정적인 글보다 많아서 나온 결과이기도 하지만 감정사전에 담겨 있지 않은 경우에도 해당된다.
질의응답
핵심어
질문
논문에서 추출한 답변
기존의 감정분석을 통한 극성 분류는 주로 무엇으로 문장규칙을 이용하여 분석해왔나요?
기존의 감정분석을 통한 극성 분류는 주로 평점을 기반으로 하는 상품평을 기준으로 문장규칙을 이용하여 분석해왔다. 이러한 분석방법은 평점이 없는 블로그 같은 경우 적용되기 어려움 점이 있고 댓글 아르바이트나 관리자에 의해 상품평이 조작될 가능성이 있어서 상품평 만으로는 상품, 매장에 대한 의견을 파악하기에는 어려움이 있다.
오피니언 마이닝이란 무엇인가요?
오피니언 마이닝(Opinion Mining)은 문서로부터 사용자가 나타내는 의견과 감점을 나타내는 패턴을 이용해 특정 대상에 대한 의견의 극성을 분류하는 기술이다. [8]은 블로그에 쓰인 글을 통하여 대중들의 주관적인 의견을 효율적으로 판단하기 위하여 오피니언 마이닝은 다른 기법에 비해 효율적이다.
감정분석 분류 기법의 프로세스의 4단계는 무엇인가요?
이를 위한 분류 기법의 단계는 총 4단계로 구성된다. 첫 번째 단계는 네티즌들의 특정 도메인에 관한 개인적인 글이 담겨있는 블로그에서 정보를 수집하는 단계이다. 두 번째 단계는 도메인과 관련하여 수집된 블로그 글 중에서 주로 언급되는 특징이 담긴 단어를 추출하는 단계이다. 세 번째 단계는 글의 극성 판별을 위한 감정분석 알고리즘을 구축 및 적용 단계이다. 마지막 단계는 감정단어 사전을 구축하여 세 번째 단계에서 구축한 감정분석 알고리즘과 비교하여 글의 극성을 판별한다. 본 장에서는 총 4단계의 프로세스를 각 절에서 자세히 설명한다.
참고문헌 (16)
Jong-Seok Song, Soo-Won Lee, "Automatic Construction of Positive/Negative Feature-Predicate Dictionary for Polarity Classification of Product Reviews", The Korean Institute of Information Scientists and Engineers: Software and Application, Vol. 38, No.3, March 2011.
Xiaowen Ding, Bing Liu, Phips S. Yu, "A Holistic Lexicon-Based Approach to Opinion Mining", Conference on Web Search and Data Mining, 2008
Sung-Ho Oh, Shin-Jae Kang, "Movie Retrieval System by Analyzing Sentimental Keyword from User's Movie Reviews", Journal of Korea Academia-Industrial cooperation Society, Vol. 14, No. 3 pp. 1422-142, July 2013.
Cheol-Seong Lee, Dong-Hee Choi, Seong-Soon Kim Jaewoo Kang, "Classification and Analysis of Emotion in Korean Microblog Texts", The Korean Institute of Information Scientists and Engineers: Database, Vol. 40, No.3, June 2013.
In-Jo Park, "The analysis of Korean affective terms: listing affective terms and exploring dimensions in the affective terms", Seoul National University, Psychology College, Master's thesis, 2001
In-Jo Park, Kyung-Hwan Min, "Making a List of Korean Emotion Terms and Exploring Dimensions Underlying Them", Korean Journal of Social and Personality Psychology, Vol. 19, No. 1, pp. 109-129, 2005.
Hong-June Yune, Han-Joon Kim, Jae-Young Chang "An Efficient Search Method of Product Reviews using Opinion Mining Techniques", The Korean Institute of Information Scientists and Engineers: CPL and Letter", Vol. 16, No. 2, February 2010.
Pavel Smrz., "Using WordNet for Opinion Mining," Proc. of the International WordNet Conference 2006, pp.333-335, 2006.
Andrea Esuli, Fabrizio Sebastiani, "PageRanking WordNet Synsets: An Application to Opinion Mining," Proc. of the Annual Meeting of the Association for Computational Linguistics 2007,pp.424-431, 2007.
Hong-Gu Choi, Een-Jun Hwang, "Emotion-based Music Recommendation System based on Twitter Document Analysis", The Korean Institute of Information Scientists and Engineers: CPL and Letter",Vol. 18, No. 11, November 2012.
Minqing Hu and Bing Liu, "Mining and Summarizing Customer Reviews." KDD'05, Seattle, Washington, USA., Aug.2004.
J. Kamps M. Marx, R. Mokken, and M. de Rijke., "Using WordNet to Measure Semantic Orientations of Adjectives" Proceedings of LREC, 2004.
Hatzivassiloglou V., Mackeown K., "Predicting the Semantic Orientation of Adjectives." Proceedings of the 8th Conference on European chapter of the assocation for Computational Linguistics, pp.174-181,1997
Kwang-Seob Shim, Jae-Hyung Yang, "MACH : A Supersonic Korean Morphological Analyzer", Proceedings of the 19th International Conference on Comp utational Linguistics (COLING-2002), pp.939-945, 2002
Kwang-Mo Ahn, Yun-Suk Kim, and Young-Hoon Kim, Young-Hoon Seo, "Sentiment Classification of Movie Reviews using Levenshtein Distance", Journal of Digital Contents Society Vol. 14, No. 4., pp.581-587, Dec. 2013
※ AI-Helper는 부적절한 답변을 할 수 있습니다.