게임 도메인 웹 코퍼스를 이용한 감성사전 구축 및 평가
Construction and Evaluation of a Sentiment Dictionary Using a Web Corpus Collected from Game Domain 원문보기

한국게임학회 논문지 = Journal of Korea Game Society, v.18 no.5, 2018년, pp.113 - 122  

정우영 (홍익대학교 대학원 게임학과(공학)) ,  배병철 (홍익대학교 대학원 게임학과(공학)) ,  조성현 (홍익대학교 대학원 게임학과(공학)) ,  강신진 (홍익대학교 대학원 게임학과(공학))

본 논문은 게임 도메인에서 웹 코퍼스를 이용하여 감성사전을 구축하는 방법과 구축한 감성사전의 평가 결과를 기술한다. 감성사전 구축을 위해 먼저 트위터 형태소 분석기를 이용해 국내 한 포털 사이트의 게임 관련 웹 문서를 기반으로 어휘를 수집하여 감성 사전 어휘 목록을 만들었고, 목록에 있는 단어들 중 동사와 형용사 품사의 단어들에 대해 감성 사전을 구축하였다. 구축된 감성 사전의 평가를 위해 영어 기반의 Senti-word Net(SWN)을 한글로 번역한 한국어 SWN을 이용하여 정밀도와 재현율 값을 계산하였다. 평가 결과 긍정과 부정 감성의 F-1 값에 대한 평균이 형용사의 경우 0.85, 동사에 대해 0.77을 각각 보여 주었다.

This paper describes an approach to building and evaluating a sentiment dictionary using a Web corpus in the game domain. To build a sentiment dictionary, we collected vocabulary based on game-related web documents from a domestic portal site, using the Twitter Korean Processor. From the collected v...


표/그림 (10)

문제 정의

  • 본 논문은 게임 도메인의 비정형 코퍼스인 웹 블로그의 문장들을 이용하여 감성 사전을 만들고, 한국어로 번역한 한국어 SWN을 이용하여 평가하였다. 평가 결과, 형용사는 84.
핵심어 질문 논문에서 추출한 답변
자연어 처리는 무슨 기술인가? 인공지능 기술의 발전은 사회 전반에 새로운 가능성을 보여주면서 다양한 분야로 그 영역을 넓혀가고 있다. 인공지능 기술 중에서 사람의 언어를 이해하고 분석하여 컴퓨터가 처리할 수 있도록 하는 자연어 처리(Natural Language Processing, NLP)는 컴퓨터과학, 언어학 등에서 오랫동안 연구되고 있는 기술이다. 최근 인공지능의 활용성이 높을 것으로 예상되는 분야에서도 자연어 처리를 이용하여 웹에 산재해 있는 비정형 데이터를 활용하고자 하는 연구가 지속적으로 진행되어 왔다[1].
감성 사전에 수록된 형용사 극성 점수의 특징은 무엇인가? 5 이상의 값을 가진 형용사 단어가 모두 22개로 확인되었다. 형용사 전체 극성 단어 중 긍정 단어가 253개이고, 부정 단어가 247개로 거의 같은 비율임에도 불구하고, 높은 긍정 점수의 단어 빈도수가 높은 부정 점수의 단어 빈도수보다 많이 관찰된 점이 특징이다.
감성 분석의 정의는 무엇인가? 감성 분석에 대한 정의는 여러 방면에서 인용되고 사용되어지고 있는데 본 논문에서는 자연어로 이루어진 단어, 문장, 문단, 문서 등의 감성을 파악하는 기법으로 정의한다[5].
