본 연구에서는 주가 결정 방법이 주가 경향 예측에 미치는 영향을 확인하기 위한 분석을 수행한다. 주식시장에서 성공적인 투자를 위해서는 주가의 상승과 하락을 정확하게 예측하는 것이 큰 도움이 되므로 주가 경향 예측에 관해 많은 연구가 진행되고 있다. 예를 들어 근래에는 SNS나 뉴스의 내용을 텍스트 마이닝을 이용하여 분석하고, 이를 이용한 주가 등락의 예측 방법이 제안되었으며 다양한 기계학습 기법들이 활용되고 있다. 그러나 주가의 경향을 '상승' 또는 '하락'으로 결정하는 방법은 제대로 분석된 적 없으며 일반적으로 쓰던 방법을 답습하고 있다. 이에 본 논문에서는 주가 경향 결정 방법을 이동평균을 이용해 일반화하고 주가 경향 결정 방법이 예측 정확도에 미치는 영향을 분석한다. 분석 결과, 다음 날의 주가 경향을 예측하는 경우, 주가 경향 결정방법에 따라 예측 정확도가 47%까지 차이가 남을 발견하였다. 또한 경향 결정에 사용되는 기준값 윈도우의 크기와 예측의 정확도는 비례 관계이며, 대상값 윈도우의 크기와 정확도는 반비례 관례임을 알 수 있었다.
본 연구에서는 주가 결정 방법이 주가 경향 예측에 미치는 영향을 확인하기 위한 분석을 수행한다. 주식시장에서 성공적인 투자를 위해서는 주가의 상승과 하락을 정확하게 예측하는 것이 큰 도움이 되므로 주가 경향 예측에 관해 많은 연구가 진행되고 있다. 예를 들어 근래에는 SNS나 뉴스의 내용을 텍스트 마이닝을 이용하여 분석하고, 이를 이용한 주가 등락의 예측 방법이 제안되었으며 다양한 기계학습 기법들이 활용되고 있다. 그러나 주가의 경향을 '상승' 또는 '하락'으로 결정하는 방법은 제대로 분석된 적 없으며 일반적으로 쓰던 방법을 답습하고 있다. 이에 본 논문에서는 주가 경향 결정 방법을 이동평균을 이용해 일반화하고 주가 경향 결정 방법이 예측 정확도에 미치는 영향을 분석한다. 분석 결과, 다음 날의 주가 경향을 예측하는 경우, 주가 경향 결정방법에 따라 예측 정확도가 47%까지 차이가 남을 발견하였다. 또한 경향 결정에 사용되는 기준값 윈도우의 크기와 예측의 정확도는 비례 관계이며, 대상값 윈도우의 크기와 정확도는 반비례 관례임을 알 수 있었다.
In this study, we analyze how stock trend determination affects trend prediction accuracy. In stock markets, successful investment requires accurate stock price trend prediction. Therefore, a volume of research has been conducted to improve the trend prediction accuracy. For example, information ext...
In this study, we analyze how stock trend determination affects trend prediction accuracy. In stock markets, successful investment requires accurate stock price trend prediction. Therefore, a volume of research has been conducted to improve the trend prediction accuracy. For example, information extracted from SNS (social networking service) and news articles by text mining algorithms is used to enhance the prediction accuracy. Moreover, various machine learning algorithms have been utilized. However, stock trend determination has not been properly analyzed, and conventionally used methods have been employed repeatedly. For this reason, we formulate the trend determination as a moving average-based procedure and analyze its impact on stock trend prediction accuracy. The analysis reveals that trend determination makes prediction accuracy vary as much as 47% and that prediction accuracy is proportional to and inversely proportional to reference window size and target window size, respectively.
In this study, we analyze how stock trend determination affects trend prediction accuracy. In stock markets, successful investment requires accurate stock price trend prediction. Therefore, a volume of research has been conducted to improve the trend prediction accuracy. For example, information extracted from SNS (social networking service) and news articles by text mining algorithms is used to enhance the prediction accuracy. Moreover, various machine learning algorithms have been utilized. However, stock trend determination has not been properly analyzed, and conventionally used methods have been employed repeatedly. For this reason, we formulate the trend determination as a moving average-based procedure and analyze its impact on stock trend prediction accuracy. The analysis reveals that trend determination makes prediction accuracy vary as much as 47% and that prediction accuracy is proportional to and inversely proportional to reference window size and target window size, respectively.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그러나 이 영향에 대해 보다 깊은 이해를 얻기 위해서는 다른 관점에서의 분석이 필요하므로, 레이블의 변화에 따라 데이터 벡터들을 나누어 예측 결과를 분석하고자 한다. 즉테스트 데이터 벡터를 경향 결정방법이 바뀌어도 레이블이 변하지 않는 데이터 벡터 그룹, 그리고 레이블이 바뀌는 그룹으로 나누고, 기준값과 대상값의 이동평균을 구하는데 사용되는 윈도우의 크기가 변할 때 이 두 가지 그룹에 속한 데이터 벡터들의 예측 성공과 실패를 관찰하여, Fig.
몇몇 연구에서는 연속된 두 종가를 사용하지 않고 이동평균을 사용한 사례도 있지만 하나의 결정 방법만을 선택하여 사용했을 뿐 결정 방법을 일반화하여 분석하지는 못했다. 따라서 본 논문에서는 두 개의 값을 비교하여 경향을 결정하는 방법을 이동평균을 이용하는 방법으로 일반화하고 이동평균을 구하는 기간을 변화시키며 정확도에 미치는 영향을 분석하고자 한다.
더욱이 기준값과 예측값의 선택은 학습과 예측에 직접적인 영향을 주며, 이 선택에 따라 예측의 전확도가 크게 달라질 수도 있다. 따라서 본 논문에서는 주가경향 결정에 사용되는 기준값과 예측값을 변화시키면서 주가예측 정확도가 받는 영향을 분석하고자 한다.
그러나 지금까지의 연구에서는 하나의 경향 결정 방법을 선택하여 사용하였으며, 대부분의 경우 오늘의 종가를 기준값으로 내일의 종가를 대상값으로 사용하는 방법이 채택되었다. 따라서 본 절에서는 기준값을 구하기 위한 윈도우와 대상값을 구하기 위한 윈도우를 변화시키며 주가 예측 정확도가 받는 영향을 측정해 본다.
또한 기본 분석과 기술분석에서 사용되는 지표 및 주가 자체를 특징 (feature)로 사용하여 기계학습 모델을 만드는 경우가 대부분이었는데, 근래에는 뉴스나 SNS에 올라온 글들을 텍스트 마이닝을 사용해 감성분석을 하는 방법 [15], 그리고 Google Trends나 Wikipedia에서 검색된 단어를 이용하는 크라우드소싱 (crowd-sourcing) 방법 [16]이 새롭게 제안되고 있다. 주가의 경향을 예측하는 데는 기존의 이동평균을 이용하는 방법 등이 있지만 기계학습을 이용하여 주가의 경향을 예측하는 것은 사람이 이동평균선을 보고 예측하는 것이 아니라 사람이 관찰할 수 없는 데이터에 내재된 정보를 이용하여 좀 더 예측의 정확도를 높이고자 함이다.
첫째, 주가 경향 예측에 사용되는 분류기나 특징벡터 등은 변경하지 않고, 오직 주가 경향 결정 방법만을 조정하여 주가 경향예측의 정확도를 향상시킬 수 있다. 즉 예측 대상 기간이 정해지면, 예측 경향 정확도 향상을 위해 경향 결정 방법에서의 기준값을 어떻게 설정해야 하는지 알게 되었다. 둘째, 서로 다른 주가 경향 결정 방법을 사용한 예측 모델들을 비교하면 확연한 성능 차이가 날 수 있다.
제안 방법
그러나 경향을 결정하는 방법은 고려하는 기간에 따라 다양해질 수 있으며, 이런 다양한 방법을 실험하고 비교하는 연구는 없었다. 따라서 본 논문에서는 경향 결정 방법을 이동평균을 이용한 기준값 윈도우 크기와 대상값 윈도우크기의 식으로 일반화하였고, 실험을 통해 경향 결정 방법이 정확도에 미치는 영향을 분석하였다. 분석을 통해 기준값 윈도우가 증가하면 예측의 정확도가 증가하고 대상값 윈도우가 증가하면 정확도가 감소함을 알 수 있었다.
분석을 통해 기준값 윈도우가 증가하면 예측의 정확도가 증가하고 대상값 윈도우가 증가하면 정확도가 감소함을 알 수 있었다. 또한 이 예측 정확도에 미치는 영향을 레이블의 전환 관점에서 분석해 보았다. 정확도가 향상된 경우는 기준값 윈도우 크기가 증가됨에 따라 학습된 모델이 향상되어 예전에는 제대로 예측하지 못하던 테스트 벡터들을 맞게 예측했기 때문이다.
두 번째 방법은 기술 분석 (technical analysis)으로 주가에 영향을 주는 요인들이 주가, 거래량 등의 값에 집약되어 있다고 보고 이들을 분석하여 패턴을 찾아내고 이를 이용하여 주가를 예측하는 방법이다. 분석을 위해 주가와 거래량으로부터 여러가지 기술지표 (technical indices)를 구하여 사용한다.
그러나 이 영향에 대해 보다 깊은 이해를 얻기 위해서는 다른 관점에서의 분석이 필요하므로, 레이블의 변화에 따라 데이터 벡터들을 나누어 예측 결과를 분석하고자 한다. 즉테스트 데이터 벡터를 경향 결정방법이 바뀌어도 레이블이 변하지 않는 데이터 벡터 그룹, 그리고 레이블이 바뀌는 그룹으로 나누고, 기준값과 대상값의 이동평균을 구하는데 사용되는 윈도우의 크기가 변할 때 이 두 가지 그룹에 속한 데이터 벡터들의 예측 성공과 실패를 관찰하여, Fig. 3과 Fig. 4에서 관찰된 패턴의 원인을 찾고자 한다.
각 주식 데이터의 70%는 학습에 사용하고 나머지 30% 는 검증용으로 사용하였다. 특징벡터 (feature vector)는 시가, 종가, 상한가, 하한가, 거래량과 같은 기본 주식 정보에 기술지표를 추가하여 총 27개의 특징으로 구성하였다. 그리고 각 특징별로 값을 –1에서 1 사이로 조정하기 위하여 정규화를 수행하였고 예측을 위한 분류기로 주식 경향예측에서 많이 사용되는 서포트벡터머신 (support vector machine)을 사용하였다.
주게 된다. 특히 주식의 경향은 상승과 하락이 +1과 –1과 같은 숫자로 표현되어 각 데이터 벡터의 레이블이 되는데, 이렇게 전환된 레이블이 우수한 예측력을 가지는 모델로 이어지는지 다음 절에서 살펴보도록 한다.
대상 데이터
Fig. 5(a)는 KEP 주식 데이터를 사용하였으며, T.wine는 5로 고정하였고 R.win이 증가할 때 레이블의 전환이 없는 테스트 벡터들에 대한 결과이다. 레이블 전환이 생기는 테스트 벡터들은 정확도의 변화에 기여도가 적기 때문에 나타내지 않았다.
분석에 사용되는 데이터는 2009년부터 2018년까지 10년 간 KOSPI200을 비롯하여 삼성전자, 기업은행, 한국전력, 모비스의 주식 데이터를 한국 거래소 웹사이트에서 내려 받아 사용하였다. 이 주식들을 선택한 이유는 이 주식들이 투자자들이 주목하는 대기업과 공기업의 주식이기 때문에 이들을 분석의 대상으로 하는 것이 더욱 의미가 있기 때문이다.
이론/모형
특징벡터 (feature vector)는 시가, 종가, 상한가, 하한가, 거래량과 같은 기본 주식 정보에 기술지표를 추가하여 총 27개의 특징으로 구성하였다. 그리고 각 특징별로 값을 –1에서 1 사이로 조정하기 위하여 정규화를 수행하였고 예측을 위한 분류기로 주식 경향예측에서 많이 사용되는 서포트벡터머신 (support vector machine)을 사용하였다. 서포트벡터머신의 커널함수로는 RBF (radial basis function)을 사용하였다.
그리고 각 특징별로 값을 –1에서 1 사이로 조정하기 위하여 정규화를 수행하였고 예측을 위한 분류기로 주식 경향예측에서 많이 사용되는 서포트벡터머신 (support vector machine)을 사용하였다. 서포트벡터머신의 커널함수로는 RBF (radial basis function)을 사용하였다.
성능/효과
Ⅲ.2.1절에서 본 것과 같이 일별 경향을 결정하는 방법에 있어서 기준값과 대상값을 구하는데 사용되는 윈도우의 크기가 커질수록 스무딩 효과가 강해져서 주식의 동일 경향 연속 횟수가 증가하고 경향 전환 비율이 높아지게 된다. 이러한 주가의 일별 경향의 변화는 학습과 분류 데이터의 레이블에 반영이 되어 모델 구축과 분류 결과에 영향을 주게 된다.
따라서 본 논문에서는 경향 결정 방법을 이동평균을 이용한 기준값 윈도우 크기와 대상값 윈도우크기의 식으로 일반화하였고, 실험을 통해 경향 결정 방법이 정확도에 미치는 영향을 분석하였다. 분석을 통해 기준값 윈도우가 증가하면 예측의 정확도가 증가하고 대상값 윈도우가 증가하면 정확도가 감소함을 알 수 있었다. 또한 이 예측 정확도에 미치는 영향을 레이블의 전환 관점에서 분석해 보았다.
win을 이용해야 한다. 종합하면 R.win이 가장 크고 T.win이 가장 작은 경우에 가장 높은 정확도를 얻을 수 있다. 따라서 R.
즉 총 네 가지의 조합들이 가능하며, 이 조합들로 조사된 연구의 84%에서 사용한 방법을 나타낼 수 있다. 이를 이용하여 주가 예측 연구에서 사용된 주가의 일별 경향을 결정하는 방법을 일반화하여 표현하면 다음과 같다.
이 분석을 통해 밝혀진 것은 다음과 같다. 첫째, 주가 경향 예측에 사용되는 분류기나 특징벡터 등은 변경하지 않고, 오직 주가 경향 결정 방법만을 조정하여 주가 경향예측의 정확도를 향상시킬 수 있다. 즉 예측 대상 기간이 정해지면, 예측 경향 정확도 향상을 위해 경향 결정 방법에서의 기준값을 어떻게 설정해야 하는지 알게 되었다.
표에 있는 논문들을 놓고 보면, 기준값으로는 오늘의 종가가 가장 많이 사용되었으며 (77%), 예측값으로는 내일의 종가가 가장 많이 사용되었다 (68%). 이렇게 경향의 결정에 주로 사용되는 대상값과 기준값이 있다는 것은 다양한 경향 결정방법이 시도되지 못했다는 것을 의미한다.
후속연구
그러나 예측의 정확도는 높아지지만, 기준값이 달라지는 것이므로 이 향상된 예측 능력이 어떻게 활용될 수 있는지는 향후 연구로 진행할 예정이다. 예를 들어 보다 높은 수익률을 위해 활용한다면, 일단 변경된 경향 결정 방법이 주식 거래와 수익률에 미치는 영향을 분석하고, 이를 바탕으로 보다 높은 수익률을 얻는 활용법을 개발할 계획이다.
또한 SVM 알고리즘이 학습을 통해 모델을 만들기 때문에 사용된 정보가 어떻게 SVM 모델에게 영향을 줬는지 알기 어렵다. 따라서 좀 더 면밀한 분석이 필요하며, 다음 절에서 기준값 윈도우와 대상값 윈도우의 크기가 주가 경향 예측 정확도에 미치는 영향을 경향의 전환 관점에서 분석하려고 한다.
참고문헌 (36)
H. S. Sim, H. I. Kim, and J. J. Ahn, "Is deep learning for image recognition applicable to stock market prediction?," Complexity, Vol.2019, pp. 1-10, Feb. 2019. DOI: 10.1155/2019/4324878
X. Zhang, Y. Hu, K. Xie, S. Wang, E. Ngai, and M. Liu, "A causal feature selection algorithm for stock prediction modeling," Neurocomputing, Vol. 142, pp. 48-59, Oct. 2014. DOI: 10.1016/j.neucom.2014.01.057
X. Zhang, Y. Zhang, S. Wang, Y. Yao, B. Fang, and P. Yu, "Improving stock market prediction via heterogeneous information fusion," Knowledge-Based Systems, Vol. 143, pp. 236-247, March 2018. DOI: 10.1016/j.knosys.2017.12.025
A. Oztekin, R. Kizilaslan, S. Freund, and A. Iseri, "A data analytic approach to forecasting daily stock returns in an emerging market," European Journal of Operational Research, Vol. 253, pp. 697-710, Sept. 2016. DOI: 10.1016/j.ejor.2016.02.056
D. Kumar, S. S. Meghwani, and M. Thakur, "Proximal support vector machine based hybrid prediction models for trend forecasting in financial markets," Journal of Computational Science, Vol. 17, pp. 1-13, Nov. 2016. DOI: 10.1016/j.jocs.2016.07.006
Z. Lei and W. Lin, "Price trend prediction of stock market using outlier data mining algorithm," Proceedings of IEEE International Conference on Big Data and Cloud Computing, pp. 93-98, 2015. DOI: 10.1109/bdcloud.2015.19
J. Zhang, S. Cui, Y. Xu, Q. Li, and T. Li, "A novel data-driven stock price trend prediction system," Expert Systems with Applications, Vol. 97, pp. 60-69, May 2018. DOI: 10.1016/j.eswa.2017.12.026
W. Chiang, D. ENke, T. Wu, and R. Wang, "An adaptive stock index trading decision support system," Expert Systems with Applications, Vol. 59, pp. 195-207, Oct. 2016. DOI: 10.1016/j.eswa.2016.04.025
Y. Chen and Y. Hao, "Integrating principle component analysis and weighted support vector machine for stock trading signals prediction," Neurocomputing, Vol. 321, pp. 381-402, Dec. 2018. DOI: 10.1016/j.neucom.2018.08.077
E. Hoseinzade and S. Haratizadeh, "CNNpred: CNN-based stock market prediction using a diverse set of variables," Expert Systems with Applications, Vol. 129, pp. 273-285, Sept. 2019. DOI: 10.1016/j.eswa.2019.03.029
W. Long, Z. Lu, and L. Cui, "Deep learning-based feature engineering for stock price movement prediction," Knowledge-Based Systems, Vol. 164, pp. 163-173, Jan. 2019. DOI: 10.1016/j.knosys.2018.10.034
R.Socher, B. Huval, B. Bhat, C. Manning, and A. Ng, "Convolutional-recursive deep learning for 3D object classification," Proceedings of International Conference on Neural Information Processing Systems, pp. 656-664, 2012.
A. Graves, A. Mohamed, and G. Hinton, "Speech recognition with deep recurrent neural networks," Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing, pp. 6645-6649, 2013. DOI: 10.1109/icassp.2013.6638947
D. Chicco, P. Sadowski, and P. Baldi, "Deep autoencoder neural networks for gene ontology annotation predictions," Proceedings of ACM Conference on Bioinformatics, COmputational Biology, and Health Informatics, pp. 533-540, 2014. DOI: 10.1145/2649387.2649442
A. Sun, M. Lachanski, and F. Fabozzi, "Trade the tweet: Social media text mining and sparse matrix factorization for stock market prediction," International Review of Financial Analysis, Vol. 48, pp. 272-281, Dec. 2016. DOI: 10.1016/j.irfa.2016.10.009
H. Hu, L. Tang, S. Zhang, and H. Wang, "Predicting the direction of stock markets using optimized neural networks with Google Trends," Neurocomputing, Vol. 285, pp. 188-195, April 2018. DOI: 10.1016/j.neucom.2018.01.038
G. Park and H. Shin, "Stock price forecasting using semi-supervised learning," Proceedings of KORMS Conference, pp. 110-116, Oct. 2010.
S. Ahn and S. Cho, "Stock prediction using news text mining and time series analysis," Proceedings of KIISE Conference, pp. 364-369, June 2010.
D. Shin and K. Jung, "Forecasting short-term KOSPI using wavelet transforms and fuzzy neural network," Journal of the Korea Contents Association, Vol. 11, No. 6, pp. 1-7, June 2011. DOI: 10.5392/JKCA.2011.11.6.001
J. Jin and J. Min, "A real-time stock market prediction using knowledge accumulation," Journal of Intelligent Information Systems, Vol. 17, No. 4, pp. 109-130, Dec. 2011. DOI: 10.13088/jiis.2011.17.4.109
J. Huh and J. Yang, "SVM based stock price forecasting using financial statements," KIISE Transactions on Computing Practices, Vol. 21, No. 3, pp. 167-172, March 2015.
Z. Hu, J. Zhu, and K. Tse, "Stocks market prediction using support vector machine," Proceedings of International Conference on Information Management, Innovation Management and Industrial Engineering, pp. 115-118, Nov. 2013. DOI: 10.1109/iciii.2013.6703096
G. Dong, K. Fataliyev, and L. Wang, "One-step and multi-step ahead stock prediction using backpropagation neural networks," Proceedings of International Conference on Information, Communicatio, and Signal Processing, pp. 1-5, 2013. DOI: 10.1109/icics.2013.6782784
F. Wang, Z. Zhao, X. Li, and H. Zhang, "Stock volatility prediction using multi-kernel learning based extreme learning machine," Proceedings of International Joint Conference on Neural Networks, pp. 3078-3085, 2014. DOI: 10.1109/ijcnn.2014.6889651
Y. Xu, Z. Li, and L. Luo, "A study on feature selection for the trend prediction of stock trading price," Proceedings of International Conference on Computational and Information Sciences, pp. 579-582, 2013. DOI: 10.1109/iccis.2013.160
K. Kim, "Financial time series forecasting using support vector machine," Neurocomputing, Vol. 55, pp. 307-319, Sept. 2003. DOI: 10.1016/s0925-2312(03)00372-2
Y. Lin, H. Guo, and J. Hu, "An SVM-based approach for stock market trend prediction," Proceedings of International Joint Conference on Neural Networks, pp. 1-7, 2013. DOI: 10.1109/ijcnn.2013.6706743
A. K. Sirohi, P. K. Mahato, and V. Attar, "Multiple kernel learning for stock price direction prediction," Proceedings of IEEE International Conference on Advances in Engineering & Technology Research, pp. 1-4, 2014. DOI: 10.1109/icaetr.2014.7012901
D. Kato and T. Nagao, "Stock prediction using multiple time series of stock prices and news articles," Proceedings of IEEE Symposium on Computers & Informatics, pp. 11-16, 2012. DOI: 10.1109/isci.2012.6222659
Y. Luo, J. Hu, X. Wei, D. Fang, and H. Shao, "Stock trends prediction based on hypergraph modeling clustering algorithm," Proceedings of IEEE International Conference on Progress in Informatics and Computing, pp. 27-31, 2014. DOI: 10.1109/pic.2014.6972289
K. Kim and I. Han, "Genetic algorithms approach to feature discretization in artificial neural networks for the prediction of stock price index," Expert Systems with Applications, Vol. 19, pp. 125-132, Aug. 2000. DOI: 10.1016/s0957-4174(00)00027-0
J. Patel, S. Shah, P. Thakkar, and K. Kotecha, "Predicting stock and stock price index movement using trend deterministic data preparation and machine learning techniques," Expert Systems with Applications, Vol. 42, pp. 259-268, Jan. 2015. DOI: 10.1016/j.eswa.2014.07.040
C. Tsai and Y. Hsiao, "Combining multiple feature selection methods for stock prediction: Union, intersection, and multi-intersection approaches," Decision Support Systems, Vol. 50, pp. 258-269, Dec. 2010. DOI: 10.1016/j.dss.2010.08.028
M. Lee, "Using support vector machine with hybrid feature selection method to the stock trend prediction," Expert Systems with Applications, Vol. 36, pp. 10896-10904, Oct. 2009. DOI: 10.1016/j.eswa.2009.02.038
L. Ni, Z. Ni, and Y. Gao, "Stock trend prediction based on fractal feature selection and support vector machine," Expert System with Applications, Vol. 38, pp. 5569-5576, May 2011. DOI: 10.1016/j.eswa.2010.10.079
A. N. Kia, S. Haratizadeh, and S. B. Shouraki, "A hybrid supervised semi-supervised graph-based model to predict one-day ahead movement of global stock markets and commodity prices," Expert Systems with Applications, Vol. 105, pp. 159-173, Sept. 2018. DOI: 10.1016/j.eswa.2018.03.037
※ AI-Helper는 부적절한 답변을 할 수 있습니다.