[학위논문]SNS와 뉴스기사의 감성분석과 기계학습을 이용한 주가예측 모형에 관한 연구 A Study on Stock Price Prediction Model Using Sentiment Analysis and Machine Learning Based on SNS and News Articles원문보기
경제의 발전과 더불어 사람들의 주식시장에 대한 관심이 증가함에 따라 수시로 변하는 주가를 예측하기 위한 다수의 연구들이 진행되고 있다. 여러 예측방법들 가운데 최근 과학기술적 방법을 이용한 많은 연구들이 활발하게 이루어지고 있으며 사용하는 데이터 또한 다양해지고 있다. 이에 본 논문에서는 주가예측의 정확도를 높이기 위해 SNS와 뉴스기사의 감성분석과 기계학습을 이용한 주가예측 모형을 제시하였다. 제시하는 주가예측 모형은 데이터 수집, ...
경제의 발전과 더불어 사람들의 주식시장에 대한 관심이 증가함에 따라 수시로 변하는 주가를 예측하기 위한 다수의 연구들이 진행되고 있다. 여러 예측방법들 가운데 최근 과학기술적 방법을 이용한 많은 연구들이 활발하게 이루어지고 있으며 사용하는 데이터 또한 다양해지고 있다. 이에 본 논문에서는 주가예측의 정확도를 높이기 위해 SNS와 뉴스기사의 감성분석과 기계학습을 이용한 주가예측 모형을 제시하였다. 제시하는 주가예측 모형은 데이터 수집, 감성사전 구축, 감성분석, 기계학습의 4단계 과정을 거쳐서 생성된다. 데이터 수집은 뉴스기사의 경우 경제관련 언론사를 대상으로, SNS의 경우 트위터를 대상으로 데이터를 수집하였다. 수집한 데이터 중 뉴스기사를 분석해 감성사전을 구축하였으며, 이를 활용해 감성분석 과정을 수행하였다. 기계학습단계에서는 감성분석을 통해 생성한 데이터를 이용하였고, 다양한 분류기법으로 예측모형을 생성하였다. 생성한 예측모형의 성능을 측정하기 위해 10중 교차검증 방식을 사용하였으며, 실험결과 다수의 방법에서 80%가 넘는 정확도를 보였고 0.8에 가까운 F1 score를 나타냈다. 이는 오피니언 마이닝 혹은 데이터 마이닝 기법들을 활용한 기존의 연구들과 비교했을 때 상당히 진전된 결과로 볼 수 있다.
경제의 발전과 더불어 사람들의 주식시장에 대한 관심이 증가함에 따라 수시로 변하는 주가를 예측하기 위한 다수의 연구들이 진행되고 있다. 여러 예측방법들 가운데 최근 과학기술적 방법을 이용한 많은 연구들이 활발하게 이루어지고 있으며 사용하는 데이터 또한 다양해지고 있다. 이에 본 논문에서는 주가예측의 정확도를 높이기 위해 SNS와 뉴스기사의 감성분석과 기계학습을 이용한 주가예측 모형을 제시하였다. 제시하는 주가예측 모형은 데이터 수집, 감성사전 구축, 감성분석, 기계학습의 4단계 과정을 거쳐서 생성된다. 데이터 수집은 뉴스기사의 경우 경제관련 언론사를 대상으로, SNS의 경우 트위터를 대상으로 데이터를 수집하였다. 수집한 데이터 중 뉴스기사를 분석해 감성사전을 구축하였으며, 이를 활용해 감성분석 과정을 수행하였다. 기계학습단계에서는 감성분석을 통해 생성한 데이터를 이용하였고, 다양한 분류기법으로 예측모형을 생성하였다. 생성한 예측모형의 성능을 측정하기 위해 10중 교차검증 방식을 사용하였으며, 실험결과 다수의 방법에서 80%가 넘는 정확도를 보였고 0.8에 가까운 F1 score를 나타냈다. 이는 오피니언 마이닝 혹은 데이터 마이닝 기법들을 활용한 기존의 연구들과 비교했을 때 상당히 진전된 결과로 볼 수 있다.
Because people's interest of the stock market has been increased with the development of economy, a lot of studies have been going to predict fluctuation of stock prices. Latterly many studies have been made using scientific and technological method among the various forecasting method, and also dat...
Because people's interest of the stock market has been increased with the development of economy, a lot of studies have been going to predict fluctuation of stock prices. Latterly many studies have been made using scientific and technological method among the various forecasting method, and also data using for study are becoming diverse. So, in this paper we propose stock prices prediction models using sentiment analysis and machine learning based on news articles and SNS data to improve the accuracy of prediction of stock prices. Stock prices prediction models that we propose are generated through the four-step process that contain data collection, sentiment dictionary construction, sentiment analysis, and machine learning. The data have been collected to target newspapers related to economy in the case of news article and to target twitter in the case of SNS data. Sentiment dictionary was built using news articles among the collected data, and we utilize it to process sentiment analysis. In machine learning phase, we generate prediction models using various techniques of classification and the data that was made through sentiment analysis. After generating prediction models, we performed 10-fold cross-validation to measure the performance of them. The experimental result showed that accuracy is over 80% in a number of ways and F1 score is closer to 0.8. The result can be seen as significantly enhanced result compared with conventional researches utilizing opinion mining or data mining techniques.
Because people's interest of the stock market has been increased with the development of economy, a lot of studies have been going to predict fluctuation of stock prices. Latterly many studies have been made using scientific and technological method among the various forecasting method, and also data using for study are becoming diverse. So, in this paper we propose stock prices prediction models using sentiment analysis and machine learning based on news articles and SNS data to improve the accuracy of prediction of stock prices. Stock prices prediction models that we propose are generated through the four-step process that contain data collection, sentiment dictionary construction, sentiment analysis, and machine learning. The data have been collected to target newspapers related to economy in the case of news article and to target twitter in the case of SNS data. Sentiment dictionary was built using news articles among the collected data, and we utilize it to process sentiment analysis. In machine learning phase, we generate prediction models using various techniques of classification and the data that was made through sentiment analysis. After generating prediction models, we performed 10-fold cross-validation to measure the performance of them. The experimental result showed that accuracy is over 80% in a number of ways and F1 score is closer to 0.8. The result can be seen as significantly enhanced result compared with conventional researches utilizing opinion mining or data mining techniques.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.