$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

MUSE 감성주석코퍼스를 활용한 문장 극성과 키워드 극성간의 불일치 현상에 대한 분석
Evaluation of the Discordance between Sentence Polarities and Keyword Polarities by Using MUSE Sentiment-Annotated Corpora 원문보기

한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회, 2016 Oct. 07, 2016년, pp.195 - 200  

조동희 (한국외국어대학교 언어인지과학과 DICORA) ,  신동혁 (한국외국어대학교 언어인지과학과 DICORA) ,  주희진 (한국외국어대학교 언어인지과학과 DICORA) ,  채병열 (한국외국어대학교 언어인지과학과 DICORA) ,  자오 원카이 (한국외국어대학교 언어인지과학과 DICORA) ,  남지순 (한국외국어대학교 언어인지과학과 DICORA)

초록
AI-Helper 아이콘AI-Helper

본 연구는 MUSE 감성 코퍼스를 활용하여 문장의 극성과 키워드의 극성이 얼마만큼 일치하고 일치하지 않은지를 분석함으로써 특히 문장의 극성과 키워드의 극성이 불일치하는 유형에 대한 연구의 필요성을 역설하고자 한다. 본 연구를 위하여 DICORA에서 구축한 MUSE 감성주석코퍼스 가운데 IT 리뷰글 도메인으로부터 긍정 1,257문장, 부정 1,935문장을, 맛집 리뷰글 도메인으로부터는 긍정 2,418문장, 부정 432문장을 추출하였다. UNITEX를 이용하여 LGG를 구축한 후 이를 위의 코퍼스에 적용하여 나타난 양상을 살펴본 결과, 긍 부정 문장에서 반대 극성의 키워드가 실현된 경우는 두 도메인에서 약 4~16%의 비율로 나타났으며, 단일 키워드가 아닌 구나 문장 차원으로 극성이 표현된 경우는 두 도메인에서 약 25~40%의 비교적 높은 비율로 나타났음을 확인하였다. 이를 통해 키워드의 극성에 의존하기 보다는 문장과 키워드의 극성이 일치하지 않는 경우들, 가령 문장 전체의 극성을 전환시키는 극성전환장치(PSD)가 실현된 유형이나 문장 내 극성 어휘가 존재하지 않지만 구 또는 문장 차원의 극성이 표현되는 유형들에 대한 유의미한 연구가 수행되어야 비로소 신뢰할만한 오피니언 자동 분류 시스템의 구현이 가능하다는 것을 알 수 있다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 기존의 다양한 연구가 키워드의 극성을 바탕으로 전체 문장의 극성을 판별하거나 유추해내는 것이 주된 접근법이었다는 점을 고려하여 본 연구에서는 실제로 전체 문장의 극성이 문장 내 실현된 키워드 극성과 얼마만큼 상호 일치하고 불일치하는 지를 파악하기 위한 분석을 진행하였다. 이에 따라 본 연구에서는 IT와 맛집 도메인의 MUSE 감성주석코퍼스를 이용하여 크게 2가지의 결과를 획득하고자 하였다.
  • 실제 코퍼스를 보면 단순히 오피니언 극성이 단일 키워드로 나타나는 경우만큼이나 이들에 대한 비중도 상당한데 키워드나 통계적 방법에 의존한 자동 분류 기술로는 이러한 문장 유형에 대한 정확하고 올바른 분석 결과를 기대하기가 쉽지 않다. 따라서 본 연구에서는 실제 감성주석코퍼스에서 이러한 양상이 어떻게 나타나는지 살펴보고, 이에 대한 논의를 진행할 것이다.
  • '의 일환으로 수행되었다. 본 연구는 MUSE 감성주석코퍼스를 UNITEX 프로그램을 사용하여 문장의 극성과 키워드의 극성이 얼마만큼 일치하고 일치하지 않는 지를 살펴보고 특히 둘 사이의 불일치 현상이 실제로 얼마만큼 나타나는지를 분석하여 이들 유형에 대한 체계적이고 언어학적인 논의가 필요함을 역설하고자 하는데 있다.
  • 또한 감성 표현이 하나의 키워드에 의해 결정되지 않고 2개 이상의 토큰이 결합된 구 단위 또는 문장 단위에서 비로소 특정 극성을 드러내는 경우를 위한 태그로서 'Frozen Phrase'와 'Frozen Sentence'도 포함되어 있다. 이런 점에서 MUSE 감성주석코퍼스는 본 연구에서 살펴보고자 하는 전체 문장과 문장 내 키워드 간 오피니언 극성의 일치 정도를 분석하고 불일치 요소의 비중은 얼마나 되는지를 평가해보기 위한 적합한 실험 데이터를 제공해 주었다.
  • 기존의 다양한 연구가 키워드의 극성을 바탕으로 전체 문장의 극성을 판별하거나 유추해내는 것이 주된 접근법이었다는 점을 고려하여 본 연구에서는 실제로 전체 문장의 극성이 문장 내 실현된 키워드 극성과 얼마만큼 상호 일치하고 불일치하는 지를 파악하기 위한 분석을 진행하였다. 이에 따라 본 연구에서는 IT와 맛집 도메인의 MUSE 감성주석코퍼스를 이용하여 크게 2가지의 결과를 획득하고자 하였다. 첫째는 긍정 극성으로 분류된 문장 내에서의 부정 키워드의 출현과 부정 극성으로 분류된 문장 내에서의 긍정 키워드의 출현 수이다.
  • 지금까지 본 연구는 오피니언 문장의 극성과 문장 내 실현된 키워드의 극성일치 정도가 얼마나 되는지를 분석·평가해 보는 것을 목적으로 수행되었다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
문장 층위의 총 6가지 분류 태그셋은 무엇인가? 두 도메인의 감성주석코퍼스는 각각 10만 어절 규모의 원시코퍼스에 기반을 두어 문장 및 토큰 층위에 대하여 반자동 구축 방식으로 감성 주석이 이루어져 있다4). 문장 층위에서는 Positive(긍정), Negative(부정), Neutral(중립), Contradictory(복합) Objective(객관), Trash(기타)의 총 6가지 분류 태그셋에 따라 이들 중 하나의 태그가 주석되어 있다. 토큰 층위의 주석은 위의 6가지 태그 중 문장 극성이 Positive, Negative, Neutral, Contradictory의 4가지 문장 유형에 대하여 수행되었다.
PSD의 종류에 대해 분석하는 것이 필요한 이유는? (4ㄷ)의 '덜어내다'는 직접적인 부정어는 아닌 것으로 간주될 수 있으나 일종의 부정술어로 작용하여 해당 문장의 극성을 긍정으로 전환하는 PSD이다. 실제로 긍정 혹은 부정적인 표현을 직접적으로 표현하지 않고 PSD를 통해 오피니언을 표출하기 때문에 한국어에서 PSD의 종류는 얼마나 되고, 어떠한 양상으로 나타나는지 파악하고 분석하는 것이 필요하다.
오피니언 마이닝은 어떻게 정의되는가? 오피니언 마이닝(Opinion Mining)이라는 용어는 [1]에 의해 사용되었듯이, 주관적인 텍스트 분석에서 가장 통용되는 용어라고 할 수 있다. [2]에 따르면, '문어 텍스트에서 나타나는 개체나 속성에 대해 사람들의 의견, 감성, 평가, 태도, 감정을 분석하는 학문 영역'으로 정의 되는데, 이는 오피니언 마이닝의 영역이 기존의 객관적 문서에 기반을 둔 정보추출 연구에서 다루지 못한 주관적인 텍스트의 분석에 집중하고 있음을 알 수 있게 한다. [3]에 따르면 오피니언 마이닝은 문서가 긍정, 부정, 또는 중립 중에서 어떠한 견해를 갖고 있는지 판별 하는 과정이라고 할 수 있으며, 분석은 우선적으로 각 문서 최소 단위인 어휘의 극성을 통해 이루어진다.
질의응답 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로