[국내논문] 뉴스기사를 이용한 소비자의 경기심리지수 생성
Construction of Consumer Confidence index based on Sentiment analysis using News articles 원문보기

지능정보연구 = Journal of intelligence and information systems, v.23 no.3, 2017년, pp.1 - 27  

송민채 (이화여자대학교 빅데이터분석학) ,  신경식 (이화여자대학교 경영대학)

경제주체들의 경기상황에 대한 판단 및 전망은 경기변동에 영향을 미치므로 경기심리지수와 거시경제지표들 간에는 밀접한 관련성을 나타내는 것으로 알려져 있다. 경기선행지표로 국내에서 많이 사용되는 경기심리지수에는 소비자동향조사, 기업경기조사, 경제심리지수가 있다. 그러나 설문조사를 통해 생성된 지수는 자료의 성격상 속보성이 떨어지는 문제가 있다. 본 연구에서는 이러한 정형데이터의 한계를 보완할 수 있도록 비정형데이터에서 정보를 추출해 경기심리지수를 생성하고, 경제분석에서의 활용 가능성을 검토하였다. 민간소비와 관련된 실물지표에는 소매판매업지수와 서비스업생산지수를 사용하였고, 고용지표에는 고용률과 실업률을, 가격지표에는 소비자물가상승률과 가계의 대출금리를 사용하여 지표들 간의 추이 분석 및 시차구조 파악을 위한 교차상관분석을 수행하였다. 마지막으로 이들 지표들에 대한 예측 가능성을 점검하였다. 분석결과, 다른 지표들의 선행지수로 많이 사용되는 소비자심리지수와 비교해 선택 지표들과 높은 상관관계를 보이며, 1~2개월 선행한 것으로 나타났다. 예측력 또한 향상되어 텍스트데이터에서 생성한 소비자 경기심리지수의 유용성이 확인되었다. 온라인에서 생성되는 뉴스기사나 소셜 SNS 등의 텍스트 데이터는 속보성이 뛰어나고, 커버리지가 넓어 특정 경제적 이슈가 발생할 경우 이것이 경제에 미치는 영향을 빠르게 파악할 수 있다는 점에서 경기판단지표로써의 잠재적 가능성이 클 것으로 보인다. 경제분석에서 비정형데이터를 활용한 국내연구는 초기 단계지만 데이터의 유용성이 확인되면 그 활용도가 크게 높아질 것으로 기대한다.

It is known that the economic sentiment index and macroeconomic indicators are closely related because economic agent's judgment and forecast of the business conditions affect economic fluctuations. For this reason, consumer sentiment or confidence provides steady fodder for business and is treated ...



핵심어 질문 논문에서 추출한 답변
감성분석은 어떻게 나뉘는가? 감성분석(Sentiment analysis)이란 텍스트에 표현된 개체와 그 속성에 대한 의견, 감성, 평가, 태도 등을 분석해 텍스트에 드러난 감성을 분류하는 것이다(Pang et al, 2002). 이러한 감성분석은 분석 데이터에 레이블(Label)이 있는 경우와 그렇지 않는 경우에 따라 크게 지도학습(Supervised learning)과 비지도학습(Unsupervisedlearning)으로 나눌 수 있다. 지도학습은 도메인에 적합하게 데이터를 학습시켜 자동으로 분류 문제를 수행하기 때문에 비지도학습에 비해 성과가 높은 것으로 나타났다(Pang and Lee, 2008).
텍스트의 감성이 이미 분류된 레이블 있는 데이터에 우선적으로 지도학습을 고려하는 이유는 무엇인가? 이러한 감성분석은 분석 데이터에 레이블(Label)이 있는 경우와 그렇지 않는 경우에 따라 크게 지도학습(Supervised learning)과 비지도학습(Unsupervisedlearning)으로 나눌 수 있다. 지도학습은 도메인에 적합하게 데이터를 학습시켜 자동으로 분류 문제를 수행하기 때문에 비지도학습에 비해 성과가 높은 것으로 나타났다(Pang and Lee, 2008). 따라서 온라인 상품평이나 영화 평점처럼 별점이나 만족도 점수 등을 통해 텍스트의 감성이 이미 분류된 레이블 있는 데이터라면 우선적으로 지도학습을 고려해볼 수 있다.
감성분석이란 무엇인가? 감성분석(Sentiment analysis)이란 텍스트에 표현된 개체와 그 속성에 대한 의견, 감성, 평가, 태도 등을 분석해 텍스트에 드러난 감성을 분류하는 것이다(Pang et al, 2002). 이러한 감성분석은 분석 데이터에 레이블(Label)이 있는 경우와 그렇지 않는 경우에 따라 크게 지도학습(Supervised learning)과 비지도학습(Unsupervisedlearning)으로 나눌 수 있다.
