최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기인지과학 = Korean journal of cognitive science, v.21 no.4, 2010년, pp.669 - 696
고민수 (서울대학교 언어학과) , 신효필 (서울대학교 언어학과)
Assuming that the whole meaning of a document is a composition of the meanings of each part, this paper proposes to study the automatic grading of movie reviews which contain sentimental expressions. This will be accomplished by calculating the values of semantic segments and performing data classif...
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
의견 극성 분류에 대한 연구 유형을 분류하면? | 첫째, 의미 사전에 기반한 방법을 이용하는 연구 유형이다. 본 연구의 경우 유의어 관계가 반영된 감정어휘 평가사전을 구축해서 극성을 판별하고, 명재석(2008) 역시 의미사전을 구축한다는 점에서 본 연구와 비교해볼 수 있다. 본 연구의 경우 Appraisal Theory(White 2005)를 통해 말뭉치로부터 검출된 각 어휘의 유의어 관계에 따라 사전을 구축한 것에 비해, 명재석(2008)에서는 사전을 White(2005)에 근거하여 작성된 Semantic Clause의 형태로 반자동으로 구성한다. 한편 Whitelaw(2005)는 White(2005)에 근거하여 Appraisal Taxonomies를 구축하여 극성을 분석했다. 둘째, 기존의 유의어 사전을 이용해서 의미를 바탕으로 어휘를 확장하여 자질로 이용하는 방법의 연구 유형이다. 의미값 기반 감정어휘 평가사전의 구축 방법은 이 유형에 연관성이 있다. 고영중(2008)은 감정 분류는 문서에 나타나는 단어 형태가 아닌 의미에 기반해야 한다는 점에 입각해서 유의어 관계에 주목했다. 유의어 추출을 위해 영단어 시소러스의 유의어 정보를 이용해 어휘를 확장하고, 대역사전을 이용해 번역하는 방법을 취했다. 이 방법은 유의어 사전을 거쳐서 생성한 유의어 목록을 확보한다는 점에서 해당 사전의 영향을 받게 된다. 영단어 시소러스를 이용하는 방법은 외국어로 기술된 사전의 의미와 단어에 원천적으로 영향을 받고, 대역사전의 오류 및 중의성 문제에 노출될 가능성이 있다. 셋째, 기계 학습을 이용해서 극성을 분류하는 방법의 연구 유형이다. 이는 자동 문서 분류에 가장 일반적으로 이용된다. Pang(2002), Dave(2003)에서와 같이 학습 자료의 평점을 기계 학습 시킨 후 극성을 예측할 수 있다는 것이 특징이다. 이는 정답으로 가정한 자료에서 극성 판별 기준이 되는 평점을 신뢰할 수 없다는 문제점이 있다. 넷째, WordNet과 같은 언어 자원을 활용하여 극성을 분류하는 방법의 연구 유형이다. 이 방법은 WordNet의 유의어, 반어의 관계를 이용하여 형용사의 극성을 예측하는 것이다. Liu(2004)는 유의어 관계의 형용사는 중심이 되는 형용사와 같은 극성을 가질 것이라고 예상했다. Esuli(2006, 2010)는 WordNet Synset과 WordNet Gloss Corpus의 어휘자원을 기반으로 극성 어휘의 정규화된 의미값을 부여하고 중의성 해소를 위해 노력했다. 유의어, 반의어 관계를 이용한다는 점은 감정어휘 평가사전의 주요 구성을 이루고 있는 유의어집합과 연관성이 있다. 이 방법의 문제점은 감정어휘가 문맥적으로 다른 용법을 갖더라도 변경하기 어렵고 기존 언어 자원에 의존하고 있고, WordNet과 같이 검증된 한국어 자원이 없기 때문에 즉시 적용할 수는 없는 방법이라는 점이다. 한국어에서는 본격적인 감정어휘 사전이 없고 현재 이를 구축하려는 노력이 시작되고 있다. 따라서 영화평 어휘를 중심으로 얻어진 어휘를 일반어휘로 확대하여 감정 어휘 사전을 구축한다는 점에서 본 연구의 의의가 있다.1) | |
감정어휘 평가사전이란? | 감정어휘 평가사전은 특정 기준에 따라 감정표현으로 분류되는 모든 어휘의미값이 저장된 의미사전이다. 특정 기준이란 Appraisal Group(Whitelaw 2005)의 개념을 응용한 의미마디이다. | |
고빈도 감정어휘일수록 보여지는 특징은? | 감정어휘란 ‘문자의 형태로 인간의 감정을 표현하기 위해 사용되고, 등급화가능성을 갖는다고 판단되는 모든 어휘’라고 정의한다. 고빈도 감정어휘일수록 해당 말뭉치에서 기본 감정표현과 관련된 기능을 한다. 감정표현을 통해 전달하고자 하는 모든 정보는 감정이 포괄하는 몇 가지 하위 영역에 속한다. |
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.