누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.
누구나 뉴스와 주가 사이에는 밀접한 관계를 있을 것이라 생각한다. 그래서 뉴스를 통해 투자기회를 찾고, 투자이익을 얻을 수 있을 것으로 기대한다. 그렇지만 너무나 많은 뉴스들이 실시간으로 생성 전파되며, 정작 어떤 뉴스가 중요한지, 뉴스가 주가에 미치는 영향은 얼마나 되는지를 알아내기는 쉽지 않다. 본 연구는 이러한 뉴스들을 수집 분석하여 주가와 어떠한 관련이 있는지 분석하였다. 뉴스는 그 속성상 특정한 양식을 갖지 않는 비정형 텍스트로 구성되어있다. 이러한 뉴스 컨텐츠를 분석하기 위해 오피니언 마이닝이라는 빅데이터 감성분석 기법을 적용하였고, 이를 통해 주가지수의 등락을 예측하는 지능형 투자의사결정 모형을 제시하였다. 그리고, 모형의 유효성을 검증하기 위하여 마이닝 결과와 주가지수 등락 간의 관계를 통계 분석하였다. 그 결과 뉴스 컨텐츠의 감성분석 결과값과 주가지수 등락과는 유의한 관계를 가지고 있었으며, 좀 더 세부적으로는 주식시장 개장 전 뉴스들과 주가지수의 등락과의 관계 또한 통계적으로 유의하여, 뉴스의 감성분석 결과를 이용해 주가지수의 변동성 예측이 가능할 것으로 판단되었다. 이렇게 도출된 투자의사결정 모형은 여러 유형의 뉴스 중에서 시황 전망 해외 뉴스가 주가지수 변동을 가장 잘 예측하는 것으로 나타났고 로지스틱 회귀분석결과 분류정확도는 주가하락 시 70.0%, 주가상승 시 78.8%이며 전체평균은 74.6%로 나타났다.
People easily believe that news and stock index are closely related. They think that securing news before anyone else can help them forecast the stock prices and enjoy great profit, or perhaps capture the investment opportunity. However, it is no easy feat to determine to what extent the two are rel...
People easily believe that news and stock index are closely related. They think that securing news before anyone else can help them forecast the stock prices and enjoy great profit, or perhaps capture the investment opportunity. However, it is no easy feat to determine to what extent the two are related, come up with the investment decision based on news, or find out such investment information is valid. If the significance of news and its impact on the stock market are analyzed, it will be possible to extract the information that can assist the investment decisions. The reality however is that the world is inundated with a massive wave of news in real time. And news is not patterned text. This study suggests the stock-index invest model based on "News Big Data" opinion mining that systematically collects, categorizes and analyzes the news and creates investment information. To verify the validity of the model, the relationship between the result of news opinion mining and stock-index was empirically analyzed by using statistics. Steps in the mining that converts news into information for investment decision making, are as follows. First, it is indexing information of news after getting a supply of news from news provider that collects news on real-time basis. Not only contents of news but also various information such as media, time, and news type and so on are collected and classified, and then are reworked as variable from which investment decision making can be inferred. Next step is to derive word that can judge polarity by separating text of news contents into morpheme, and to tag positive/negative polarity of each word by comparing this with sentimental dictionary. Third, positive/negative polarity of news is judged by using indexed classification information and scoring rule, and then final investment decision making information is derived according to daily scoring criteria. For this study, KOSPI index and its fluctuation range has been collected for 63 days that stock market was open during 3 months from July 2011 to September in Korea Exchange, and news data was collected by parsing 766 articles of economic news media M company on web page among article carried on stock information>news>main news of portal site Naver.com. In change of the price index of stocks during 3 months, it rose on 33 days and fell on 30 days, and news contents included 197 news articles before opening of stock market, 385 news articles during the session, 184 news articles after closing of market. Results of mining of collected news contents and of comparison with stock price showed that positive/negative opinion of news contents had significant relation with stock price, and change of the price index of stocks could be better explained in case of applying news opinion by deriving in positive/negative ratio instead of judging between simplified positive and negative opinion. And in order to check whether news had an effect on fluctuation of stock price, or at least went ahead of fluctuation of stock price, in the results that change of stock price was compared only with news happening before opening of stock market, it was verified to be statistically significant as well. In addition, because news contained various type and information such as social, economic, and overseas news, and corporate earnings, the present condition of type of industry, market outlook, the present condition of market and so on, it was expected that influence on stock market or significance of the relation would be different according to the type of news, and therefore each type of news was compared with fluctuation of stock price, and the results showed that market condition, outlook, and overseas news was the most useful to explain fluctuation of news. On the contrary, news about individual company was not statistically significant, but opinion mining value showed tendency opposite to stock price, and the reason can be thought to be the appearance of promotional and
People easily believe that news and stock index are closely related. They think that securing news before anyone else can help them forecast the stock prices and enjoy great profit, or perhaps capture the investment opportunity. However, it is no easy feat to determine to what extent the two are related, come up with the investment decision based on news, or find out such investment information is valid. If the significance of news and its impact on the stock market are analyzed, it will be possible to extract the information that can assist the investment decisions. The reality however is that the world is inundated with a massive wave of news in real time. And news is not patterned text. This study suggests the stock-index invest model based on "News Big Data" opinion mining that systematically collects, categorizes and analyzes the news and creates investment information. To verify the validity of the model, the relationship between the result of news opinion mining and stock-index was empirically analyzed by using statistics. Steps in the mining that converts news into information for investment decision making, are as follows. First, it is indexing information of news after getting a supply of news from news provider that collects news on real-time basis. Not only contents of news but also various information such as media, time, and news type and so on are collected and classified, and then are reworked as variable from which investment decision making can be inferred. Next step is to derive word that can judge polarity by separating text of news contents into morpheme, and to tag positive/negative polarity of each word by comparing this with sentimental dictionary. Third, positive/negative polarity of news is judged by using indexed classification information and scoring rule, and then final investment decision making information is derived according to daily scoring criteria. For this study, KOSPI index and its fluctuation range has been collected for 63 days that stock market was open during 3 months from July 2011 to September in Korea Exchange, and news data was collected by parsing 766 articles of economic news media M company on web page among article carried on stock information>news>main news of portal site Naver.com. In change of the price index of stocks during 3 months, it rose on 33 days and fell on 30 days, and news contents included 197 news articles before opening of stock market, 385 news articles during the session, 184 news articles after closing of market. Results of mining of collected news contents and of comparison with stock price showed that positive/negative opinion of news contents had significant relation with stock price, and change of the price index of stocks could be better explained in case of applying news opinion by deriving in positive/negative ratio instead of judging between simplified positive and negative opinion. And in order to check whether news had an effect on fluctuation of stock price, or at least went ahead of fluctuation of stock price, in the results that change of stock price was compared only with news happening before opening of stock market, it was verified to be statistically significant as well. In addition, because news contained various type and information such as social, economic, and overseas news, and corporate earnings, the present condition of type of industry, market outlook, the present condition of market and so on, it was expected that influence on stock market or significance of the relation would be different according to the type of news, and therefore each type of news was compared with fluctuation of stock price, and the results showed that market condition, outlook, and overseas news was the most useful to explain fluctuation of news. On the contrary, news about individual company was not statistically significant, but opinion mining value showed tendency opposite to stock price, and the reason can be thought to be the appearance of promotional and
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
다음으로 유형별 뉴스가 주가의 등락과 유의한 관계를 가지는지 살펴보았다. 뉴스 유형에는 환율의 변화, 경기 흐름, 정부 정책 등의 경제뉴스를 비롯하여 지금 당장의 주식시장 흐름을 보여주는 시황 뉴스, 주가의 상승/하락을 예측하는 전망 뉴스, 경제 여건에 따라 영향을 받거나 특별하게 언급될 만한 업종 뉴스, 개별 기업의 성과 등을 알리는 종목 뉴스, 미국·유럽 등의 해외시장에 대한 소식을 전하는 해외뉴스 등이 있다.
본 연구에서는 빅데이터 분석기법 중 오피니언 마이닝을 이용하여 비정형 뉴스 컨텐츠의 감성을 분석하고 수치화하여 뉴스가 주식 시장에 미칠 영향을 분석하였으며, 이를 통해 투자정보를 생성하는 지능형 투자의사결정 모형을 제시하고자 하였다. 또한 이러한 모형의 핵심 근간인 뉴스와 주가간의 관계를 실증 분석함으로써 뉴스 컨텐츠가 오피니언 마이닝을 통해 투자정보로 제시될 수 있는지 확인해 보고자 한다.
본 연구는 뉴스와 주가가 밀접한 관계를 가지고 있을 것 이라는 가정에서 출발하여 뉴스와 주가의 관계를 살펴보고, 뉴스를 분석하여 투자정보를 추출하고자 하였다. 뉴스는 그 속성상 비정형 텍스트로 구성되어 있으며 하루에도 수없이 많은 뉴스가 실시간으로 양산되고 있다.
최근 이러한 대량의 데이터를 분석하여 의미 있는 정보로 변환하고자 하는 빅데이터 분석이 주목 받고 있으나 아직은 초기 단계라 할 수 있다. 본 연구에서는 빅데이터 분석기법 중 오피니언 마이닝을 이용하여 비정형 뉴스 컨텐츠의 감성을 분석하고 수치화하여 뉴스가 주식 시장에 미칠 영향을 분석하였으며, 이를 통해 투자정보를 생성하는 지능형 투자의사결정 모형을 제시하고자 하였다. 또한 이러한 모형의 핵심 근간인 뉴스와 주가간의 관계를 실증 분석함으로써 뉴스 컨텐츠가 오피니언 마이닝을 통해 투자정보로 제시될 수 있는지 확인해 보고자 한다.
가설 설정
•뉴스의 긍정/부정 의견 보다 긍정/부정 비율이 주가변동을 더 잘 설명할 것이다.
•뉴스의 긍정/부정 의견은 주가에 영향을 미칠 것이다.
•뉴스의 유형에 따라 주가에 미치는 영향이 다를 것이다.
제안 방법
이는 곧 뉴스와 주가간의 관계가 명확해야 함을 의미한다. 그러므로 시스템의 유효성을 검증하기 위해 뉴스 컨텐츠의 오피니언 결과와 주가와의 관계를 통계기법을 이용하여 실증 분석하고자 한다. 이를 위해 다음과 같은 가설을 제시하고 검증한다.
뉴스가 발생한 시점이 주식시장 개장중일때와 그렇지 않을 때 미치는 영향이 다를 수 있음을 감안하여 [Figure 4]와 같이 뉴스의 시간별 구분을 하였고, 주식시장 개장인 오전 9시를 기준으로 전일 장마감 후부터 당일 오전 9시 까지를 “장전뉴스”, 9시부터 오후 3시까지는 “장중뉴스”로 구분하고, “뉴스”는 “장전뉴스”와 “장중뉴스”를 포함하였다.
뉴스의 긍정/부정 의견과 주가지수 등락이 서로 유사한 패턴을 보이는지 살펴보기 위해 조사기간 동안의 주가지수 등락의 흐름과 일자별 뉴스의 긍정/부정 마이닝 결과를 수치로 환산하여 그래프로 비교해 보았다. 아래 [Figure 5]에서 보이는 바와 같이 두 그래프가 매우 유사한 흐름을 보이고 있음을 알 수 있다.
대량의 뉴스를 시스템 적으로 수집·분류·분석하여 투자정보를 생성하기 위해 빅데이터 분석기법 중 오피니언 마이닝분석을 이용하였고, 이를 기반으로 지능형 투자의사 결정 모형을 제시하였다.
첫째 가설을 살펴보기 위해 뉴스의 긍정/부정 오피니언을 평가하고 이를 주식시장 개장 전후로 구분하여 뉴스의 긍정/부정 의견과 주가 등락 사이에 유의한 관계가 있는지를 분석한다. 또한 다양한 뉴스의 유형이 각기 주가지수 등락과 관계가 있는지를 분석한다.
본 연구는 뉴스와 주가의 관계를 뉴스 컨텐츠의 오피니언 마이닝을 통해 최초로 해석하였고, 더 나아가 시스템적으로 오피니언 마이닝을 수행하고 투자정보를 도출하여 지원할 수 있는 지능형 투자 의사결정모형을 제시하고 이를 검증하였다. 이는 뉴스를 주가지수 투자예측의 변수로서 활용할 수 있음을 보여주는 것이며, 향후 시스템으로 구현되고 검증된다면 실물투자 지원시스템으로서 활용될 수 있을 것으로 기대된다.
본 연구에서 제시한 지능형 투자의사결정 모형은 뉴스 컨텐츠의 분석결과를 투자정보로 변환하여 투자의사결정을 지원하는 것이다. 이는 곧 뉴스와 주가간의 관계가 명확해야 함을 의미한다.
다음 단계는 뉴스 컨텐츠의 텍스트를 형태소로 분리하여 극성을 판단할 수 있는 단어를 도출하고 이를 긍정/부정 사전과 비교하여 단어 별 긍정/부정 극성을 태깅한다. 세 번째는 인덱싱 된 분류정보와 스코어링 룰을 이용하여 뉴스의 긍정/부정 극성을 판별하고 이를 다시 일별 스코어링 기준에 의해 최종 투자 의사결정 정보를 도출한다. 뉴스의 긍정/부정 극성을 판별하고 계산하는 식은 다음과 같다.
첫째 가설을 살펴보기 위해 뉴스의 긍정/부정 오피니언을 평가하고 이를 주식시장 개장 전후로 구분하여 뉴스의 긍정/부정 의견과 주가 등락 사이에 유의한 관계가 있는지를 분석한다. 또한 다양한 뉴스의 유형이 각기 주가지수 등락과 관계가 있는지를 분석한다.
대상 데이터
본 연구를 위해 한국거래소에서 2011년 7월부터 9월까지 3개월간 주식시장이 개장된 63일의 KOSPI 지수와 지수등락폭을 수집하였고, 뉴스 데이터는 포털 사이트인 네이버의 증권정보 > 뉴스 > 주요뉴스에 게재된 기사 중 실시간 경제뉴스 매체 M사의 기사 766건을 웹 페이지에서 파싱하여 수집하였다.
데이터처리
대량의 뉴스를 시스템 적으로 수집·분류·분석하여 투자정보를 생성하기 위해 빅데이터 분석기법 중 오피니언 마이닝분석을 이용하였고, 이를 기반으로 지능형 투자의사 결정 모형을 제시하였다. 그리고, 모형의 유효성을 증명하기 위해 뉴스 오피니언 마이닝 결과와 주가 지수 간의 관계를 통계기법을 이용하여 실증 분석하였다.
뉴스 텍스트 마이닝을 위한 형태소 분석과 극성 분류는 워즈워드 seHANA SW를 사용하였고, 수집된 데이터의 통계 분석은 IBM-PASW 18을 이용하였다.
마지막으로 뉴스의 긍정/부정 의견과 주가의 관계를 기반으로 한 투자의사결정 함수를 도출하고자 중회귀분석과 로지스틱 회귀분석을 실시하였고, 그 결과 주식시장 개장 전 시황·전망·해외 뉴스를 변수로 한 회귀식이 통계적으로 유의하였으며, 각 변수의 회귀계수로는 시황뉴스와 전망뉴스가 통계적으로 유의함을 알 수 있었다.
마지막으로 주가지수등락을 예측하기 위한 투자 의사결정함수를 도출하고자 일자 별 장전 시황·전망·해외뉴스의 긍정부정 비율을 이용하여 로지스틱 회귀분석을 실시하였다.
뉴스 유형에는 환율의 변화, 경기 흐름, 정부 정책 등의 경제뉴스를 비롯하여 지금 당장의 주식시장 흐름을 보여주는 시황 뉴스, 주가의 상승/하락을 예측하는 전망 뉴스, 경제 여건에 따라 영향을 받거나 특별하게 언급될 만한 업종 뉴스, 개별 기업의 성과 등을 알리는 종목 뉴스, 미국·유럽 등의 해외시장에 대한 소식을 전하는 해외뉴스 등이 있다. 이러한 뉴스 유형에 따라 주식시장에 미치는 영향이나 그 관계의 유의성이 다를 것으로 예상되어 주가의 등락과 비교하여 T검정을 실시하였다.
주가지수 변동을 예측하기 위해서 어떤 유형의 뉴스를 변수로 사용해야 할 것인지, 주가지수와의 관계와 설명력은 어느 정도인지 알아보기 위해 유형별 뉴스와 주가지수를 대상으로 다중회귀분석을 실시하였다.
성능/효과
4) 투자의사결정정보는 투자의사결정 회귀함수 Ŷ를 통해 Buy/Sell 의견을 제시한다.
결과적으로 앞서 분석한 뉴스 유형과 주가등락 T검정에서 유의하였던 시황·전망·해외뉴스만을 변수로 하였을 때의 회귀식이 신뢰수준 99%에서 통계적으로 유의하였으며, [Table 6]에서 보여지듯 총 변동에 대한 설명력도 뉴스에서 52.7%, 장전뉴스만을 대상으로 분석하였을 때에도 51.8%로 비교적 높게 나타났다.
그 결과 뉴스 컨텐츠의 긍정/부정 오피니언과 주가 등락과는 유의한 관계를 가지며, 긍정/부정의 단순화된 의견으로 판별되는 뉴스 오피니언을 긍정/부정 비율로 도출하여 적용할 때 주가지수의 흐름을 더 잘 설명하는 것으로 나타났다. 또한 뉴스가 주가변동에 영향을 미치거나 적어도 선행하고 있는가를 확인하기 위해 주식시장 개장 전 발생한 뉴스들만으로 주가흐름과 비교한 결과 역시 통계적으로 유의한 것으로 확인되었다.
그러나, 회귀모형의 적합도와는 별개로 각 독립변수의 회귀계수에 대한 유의확률을 통계적 유의수준 α = 0.05과 비교해보면 [Table 8]에 보여지는 바와 같이 장전시황(.003)과 장전전망(.023) 뉴스만이 통계적으로 유의한 것으로 나타났다.
그 결과 뉴스 컨텐츠의 긍정/부정 오피니언과 주가 등락과는 유의한 관계를 가지며, 긍정/부정의 단순화된 의견으로 판별되는 뉴스 오피니언을 긍정/부정 비율로 도출하여 적용할 때 주가지수의 흐름을 더 잘 설명하는 것으로 나타났다. 또한 뉴스가 주가변동에 영향을 미치거나 적어도 선행하고 있는가를 확인하기 위해 주식시장 개장 전 발생한 뉴스들만으로 주가흐름과 비교한 결과 역시 통계적으로 유의한 것으로 확인되었다.
또한 뉴스에는 사회·경제, 해외소식, 기업실적, 업종현황, 시장전망, 시장현황 등 다양한 형태와 정보를 내포하고 있는 만큼 뉴스 유형에 따라 주식시장에 미치는 영향이나 그 관계의 유의성이 다를 것으로 예상되어 유형별 뉴스와 주가의 등락을 비교한 결과 시황·전망·해외 뉴스가 주가변동을 설명하는 데 가장 유용한 것으로 나타났다.
또한 시황·전망·해외뉴스 변수 사이의 VIF가 3 이하로 다중공선성에도 문제가없는것으로분석되었다.
분석결과 모든 유형의 뉴스를 대상으로 주가를 설명하고자 했을 때의 회귀식은 유효하지 않은 것으로 나타났다. 결과적으로 앞서 분석한 뉴스 유형과 주가등락 T검정에서 유의하였던 시황·전망·해외뉴스만을 변수로 하였을 때의 회귀식이 신뢰수준 99%에서 통계적으로 유의하였으며, [Table 6]에서 보여지듯 총 변동에 대한 설명력도 뉴스에서 52.
예측 결과의 분류정확도는 [Table 7]과 같이 주가하락에 대해서 70.0%, 주가상승에 대해서는 78.8%로 주가하락보다는 주가상승에 대한 분류정확도가 조금 더 높았으며, 전체적으론 74.6%의 정확도를 보여주고 있다.
오피니언 마이닝에서는 분석결과를 긍정 또는 부정 의견으로 단순 판별하는 경향이 있으나, 본 연구에서는 뉴스 컨텐츠를 긍정/부정 의견으로 단순화하기 보다는 긍정/부정을 비율로 산출하여 분석할 때 더 높은 설명력을 가질 것으로 예상하였다. 이에 대한 비교 결과 [Table 5]와 같이 긍정/부정 비율로 분석하였을 때 주가변동에 미치는 영향에 대한 설명력이 더 높은 것으로 나타났다.
뉴스의 긍정/부정 개수와 비율은 아래 [Table 2]와 같다. 조사기간 내 주가가 상승한 날은 33일로 하락한 30일보다 많았음에도 불구하고 뉴스의 60%가 부정의견을 보였고, 단지 20%만이 긍정의견으로 판명되었다. 이는 극명하게 시장이 좋지 않은 한 뉴스는 대체로 보수적 관점의 조심스러운 태도를 보이고 있음을 알 수 있다.
회귀식의 -2 Log 우도는 55.330이였으며, 모형의 적합도 검정 Hosmer와 Lemeshow 검정의 유의확률 값이 .204로 α = 0.05보다 크므로 모형이 부적합하다는 귀무가설을 기각하였고, 독립변수 모두 통계적으로 유의하여(유의확률 = .000) 장전 시황·전망·해외 뉴스가 주가에 영향을 미치는 회귀모형은 유용하다고 할 수 있다.
후속연구
그럼으로 향후 연구에서는 주식시장에 특화된 도메인 감성사전을 구축하고, 충분한 양의 데이터를 수집하여 분석한다면 지능형 투자의사결정모형의 완성도를 높일 수 있을 것이다. 또한 모형을 실제 지능형 투자의사결정 시스템으로 구현하고 도출된 투자정보를 선물·옵션 투자와 같은 실물 투자에 시뮬레이션 해봄으로써 투자성과를 확인하고 조정하여 모형의 예측력과 정확도를 높일 수 있을 것으로 기대된다.
둘째 가설은 본 모형이 오피니언 마이닝으로 뉴스의 긍정/부정 의견을 도출하지만, 긍정 또는 부정이라는 단순 평가보다는 뉴스가 가진 긍정/부정 비율을 계산하여 이를 활용한다면 좀 더 세밀한 비교가 가능할 것으로 예측되어 이를 검증하고자 한다. 본 가설이 맞는다면 긍정부정 비율을 이용할 때 주가지수와의 관계를 더 잘 예측할 수 있을 것이다.
그럼으로 향후 연구에서는 주식시장에 특화된 도메인 감성사전을 구축하고, 충분한 양의 데이터를 수집하여 분석한다면 지능형 투자의사결정모형의 완성도를 높일 수 있을 것이다. 또한 모형을 실제 지능형 투자의사결정 시스템으로 구현하고 도출된 투자정보를 선물·옵션 투자와 같은 실물 투자에 시뮬레이션 해봄으로써 투자성과를 확인하고 조정하여 모형의 예측력과 정확도를 높일 수 있을 것으로 기대된다.
둘째 가설은 본 모형이 오피니언 마이닝으로 뉴스의 긍정/부정 의견을 도출하지만, 긍정 또는 부정이라는 단순 평가보다는 뉴스가 가진 긍정/부정 비율을 계산하여 이를 활용한다면 좀 더 세밀한 비교가 가능할 것으로 예측되어 이를 검증하고자 한다. 본 가설이 맞는다면 긍정부정 비율을 이용할 때 주가지수와의 관계를 더 잘 예측할 수 있을 것이다.
본 연구를 위해 수집한 3개월간의 뉴스 800여건은 KOSPI 대비 63일의 주가에 해당되어, 뉴스와 주가를 비교하기에는 데이터가 충분하지 못하였으며, 경제·주식시장에 특화된 도메인 감성 사전을 구축하지 못하고 범용 감성 사전을 이용함으로써 긍정/부정 극성 분류의 정확도가 다소 낮을 수 있다는 한계를 가지고 있다.
본 연구는 뉴스와 주가의 관계를 뉴스 컨텐츠의 오피니언 마이닝을 통해 최초로 해석하였고, 더 나아가 시스템적으로 오피니언 마이닝을 수행하고 투자정보를 도출하여 지원할 수 있는 지능형 투자 의사결정모형을 제시하고 이를 검증하였다. 이는 뉴스를 주가지수 투자예측의 변수로서 활용할 수 있음을 보여주는 것이며, 향후 시스템으로 구현되고 검증된다면 실물투자 지원시스템으로서 활용될 수 있을 것으로 기대된다.
질의응답
핵심어
질문
논문에서 추출한 답변
Manovich는 빅데이터를 무엇이라고 정의하였는가?
빅데이터의 전통적 개념은 구글과 같은 대기업이나 NASA의 연구과학 프로젝트에서 분석하는 대용량의 데이터를 일컫는 것이었다(Nerv Adrian, 2011). Manovich(2011)는 시간 흐름상 데이터를 수집하고 처리하던 소프트웨어 도구의 능력을 넘어서는 데이터들의 모임을 빅데이터로 정의하고, 이런 데이터의 크기는 앞으로 꾸준하게 그 범위가 변화할 것이라고 하였다. McKinsey에서는 빅데이터를 수집·저장·소통·집단화·분석이 가능한 거대한 데이터 풀(Pool)로서 정의하고, 이제는 글로벌 경제의 모든 영역과 기능의 일부가 되었다고 하였다(McKinsey and Company, 2011).
최근 소셜미디어와 같은 비정형 데이터의 증가로 빅데이터는 어떤 분석 방법이 주목을 받고 있는가?
이러한 빅데이터를 분석하는 다양한 기법들이 있지만, 최근 소셜미디어 등 비정형 데이터의 증가로 인해 텍스트 마이닝, 오피니언 마이닝, 소셜네트워크 분석, 군집 분석 등이 주목을 받고 있다(조성우, 2011).
전통적으로 주가 예측을 위한 연구들은 주로 무엇을 활용하여 통계적 분석을 진행했는가?
예로부터 주가 예측을 위한 많은 연구들이 있었다. 전통적으로 이러한 연구들은 주로 시계열분석 또는 펀더멘털 관점에서의 통계적 분석을 시도하였다. 시계열분석은 주가자체가 모든 정보를 반영한다는 믿음에 기반하며, 펀더멘털분석은 주가가 이자율 등의 거시경제 변수에 영향을 받는다는 것이다.
참고문헌 (20)
김선웅, 안현철, "Support Vector Machines와 유전자 알고리즘을 이용한 지능형 트레이딩 시스템 개발", 지능정보연구, 16권 1호, 2010.
김진화, 홍광헌, 민진영, "지식 누적을 이용한 실시간 주식시장 예측", 지능정보연구, 17권 4호(2011).
박종엽, 한인구, "인공신경망을 이용한 한국종합주가지수의 방향성 예측", 한국전문가시스템학회지, 2호(1995).
송종석, 이수원, "상품평 극성 분류를 위한 특징별 서술어 긍정/부정 사전 자동 구축", 정보과학회논문지 : 소프트웨어 및 응용, 38권 3호(2011).
송치영, "뉴스가 금융시장에 미치는 영향에 관한 연구", 국제경제연구, 8권 3호(2005).
신종화, 이의철, "한국형 경제 뉴스 속보가 금융 시장에 미친 영향", 한국경영학회 통합학술대회,2010.
안성원, 조성배, "뉴스 텍스트 마이닝과 시계열 분석을 이용한 주가예측", 2010 한국컴퓨터 종합학술대회 논문집, 37권 1(C)호(2010).
안희중, 전승표, "남북관계 관련 뉴스가 주식시장에 미치는 영향", 한국금융연구원 한국경제의분석, 16권 2호(2010).
이근영, "북한 핵 관련 뉴스가 국내주식 및 외환시장에 미치는 영향", 동북아경제연구, 18권 1호(2006).
윤홍준, 김한준, 장재영, "오피니언 마이닝 기술을 이용한 효율적 상품평 검색 기법", 정보과학회논문지 : 컴퓨팅의 실제 및 레터, 16권 2호( 2010).
조성우, "Big Data 시대의 기술", KT종합기술원, 2011.
채승병, "정보홍수 속에서 금맥 찾기 : 빅데이터 분석과 활용", SERI 경영노트, 91호(2011).
James, Manyika, Michael Chui, Brad Brown, Jacques Bughin, Richard Dobbs, Charles Roxburgh, and Angela Hung Byers, "Big Data : The Next Frontier for Innovation, Competition, and Productivity", McKinsey and Company, The McKinsey Global Institute, 2011.
Lee, Gillam, Khurshid Ahmad, Saif Ahmad, Matthew Casey, David Cheng, Tugba Taskaya, Paulo C F de Oliveira and Pensiri Manomaisupat. "Economic News and Stock Market Correlation : A Study of the UK Market", In Conferenceon Terminology and Knowledge Engineering, 2002.
Manovich, L., "Trending : The Promises and the Challenges of Big Social Data", Debatesinthe Digital Humanities, 2011.
Mark, L. Mitchell and J. Harold Mulherin, "The Impact of Public Information on the Stock Market", The Journal of Fiance, Vol.XL IX, No.3(1994).
Pietro Veronesi, "Stock Market Overreaction to Bad News in Good Times : A Rational Expectations Equilibrium Model", The Review of Financial Studies, Vol.12, No.5(1999).
Tak-shung Fu, Ka-ki Lee, Donahue Sze, Fu-lai Chung, and Chak-man Ng, "Discovering the Correlation between Stock Time Series and Financial News", Proc. of the 2008 IEEE/ WIC/ACM International Conference on Web Intelligenceand Intelligent Agent Technology, 2008.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.