$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"
쳇봇 이모티콘
안녕하세요!
ScienceON 챗봇입니다.
궁금한 것은 저에게 물어봐주세요.

논문 상세정보

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용

A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market

초록

지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

Abstract

Over the past decade, deep learning has been in spotlight among various machine learning algorithms. In particular, CNN(Convolutional Neural Network), which is known as the effective solution for recognizing and classifying images or voices, has been popularly applied to classification and prediction problems. In this study, we investigate the way to apply CNN in business problem solving. Specifically, this study propose to apply CNN to stock market prediction, one of the most challenging tasks in the machine learning research. As mentioned, CNN has strength in interpreting images. Thus, the model proposed in this study adopts CNN as the binary classifier that predicts stock market direction (upward or downward) by using time series graphs as its inputs. That is, our proposal is to build a machine learning algorithm that mimics an experts called 'technical analysts' who examine the graph of past price movement, and predict future financial price movements. Our proposed model named 'CNN-FG(Convolutional Neural Network using Fluctuation Graph)' consists of five steps. In the first step, it divides the dataset into the intervals of 5 days. And then, it creates time series graphs for the divided dataset in step 2. The size of the image in which the graph is drawn is $40(pixels){\times}40(pixels)$, and the graph of each independent variable was drawn using different colors. In step 3, the model converts the images into the matrices. Each image is converted into the combination of three matrices in order to express the value of the color using R(red), G(green), and B(blue) scale. In the next step, it splits the dataset of the graph images into training and validation datasets. We used 80% of the total dataset as the training dataset, and the remaining 20% as the validation dataset. And then, CNN classifiers are trained using the images of training dataset in the final step. Regarding the parameters of CNN-FG, we adopted two convolution filters ($5{\times}5{\times}6$ and $5{\times}5{\times}9$) in the convolution layer. In the pooling layer, $2{\times}2$ max pooling filter was used. The numbers of the nodes in two hidden layers were set to, respectively, 900 and 32, and the number of the nodes in the output layer was set to 2(one is for the prediction of upward trend, and the other one is for downward trend). Activation functions for the convolution layer and the hidden layer were set to ReLU(Rectified Linear Unit), and one for the output layer set to Softmax function. To validate our model - CNN-FG, we applied it to the prediction of KOSPI200 for 2,026 days in eight years (from 2009 to 2016). To match the proportions of the two groups in the independent variable (i.e. tomorrow's stock market movement), we selected 1,950 samples by applying random sampling. Finally, we built the training dataset using 80% of the total dataset (1,560 samples), and the validation dataset using 20% (390 samples). The dependent variables of the experimental dataset included twelve technical indicators popularly been used in the previous studies. They include Stochastic %K, Stochastic %D, Momentum, ROC(rate of change), LW %R(Larry William's %R), A/D oscillator(accumulation/distribution oscillator), OSCP(price oscillator), CCI(commodity channel index), and so on. To confirm the superiority of CNN-FG, we compared its prediction accuracy with the ones of other classification models. Experimental results showed that CNN-FG outperforms LOGIT(logistic regression), ANN(artificial neural network), and SVM(support vector machine) with the statistical significance. These empirical results imply that converting time series business data into graphs and building CNN-based classification models using these graphs can be effective from the perspective of prediction accuracy. Thus, this paper sheds a light on how to apply deep learning techniques to the domain of business problem solving.

질의응답 

키워드에 따른 질의응답 제공
핵심어 질문 논문에서 추출한 답변
합성곱 신경망
합성곱 신경망이란 무엇인가?
패턴이나 물체를 인식하는 생물의 시각처리과정을 모방한 모형

딥러닝 알고리즘의 일종인 합성곱 신경망(convolutional neural network, CNN)은 패턴이나 물체를 인식하는 생물의 시각처리과정을 모방한 모형으로써 LeCun et al.(1998)에 의해 합성곱 신경망이 발전하는 계기가 되었다.

주가지수 예측을 위한 방법
주가지수 예측을 위한 방법에는 무엇이 있는가?
회사의 가치를 분석하여 현재 시장가격과의 차이를 밝혀 향후 가격을 예측하는 기본적 분석기법과 시간 변화에 따른 시장가격 변동을 연구하여 패턴을 찾아내고 향후 가격을 예측하는 기술적 분석기법

주가지수 예측을 위한 방법으로는 회사의 가치를 분석하여 현재 시장가격과의 차이를 밝혀 향후 가격을 예측하는 기본적 분석기법과 시간 변화에 따른 시장가격 변동을 연구하여 패턴을 찾아내고 향후 가격을 예측하는 기술적 분석기법이 있다. 그러나 주식시장에서 발생하는 예측하기 어려운 다양한 변수들로 인해 예측 정확성은 뛰어나지 못하다.

주가예측
현업에서 주가예측을 하기 위해 무엇을 하고 있는가?
기술적 분석 전문가들이 과거의 주가지수나 거래량 등 주식시장에서 나타나는 데이터와 차트를 분석하여 주가동향과 투자심리 등을 예측하려고 시도

주가예측은 주식시장에서 발생하는 다양한 요인들로 인해 예측하기 어려운 문제 중 하나이다. 현업에서는 이른바 기술적 분석 전문가들이 과거의 주가지수나 거래량 등 주식시장에서 나타나는 데이터와 차트를 분석하여 주가동향과 투자심리 등을 예측하려고 시도하고 있다. 학계에서는 인공신경망, SVM(support vector machine) 등 전통적인 기계학습 알고리즘을 이용하여 주식시장에서 기술적 분석을 위해 사용하는 기술지표들을 입력변수로 사용하여 주식시장을 예측하려는 연구들이 주로 발표되어 왔다(Kim et al.

질의응답 정보가 도움이 되었나요?

참고문헌 (20)

  1. 1. Ahn, H. and K.-j. Kim, "Using genetic algorithms to optimize nearest neighbors for data mining," Annals of Operations Research, Vol.163, No.1(2008), 5-18. 
  2. 2. Chung, Y., S.M. Ahn., J. Yang, and J. Lee, "Comparison of Deep Learning Frameworks: About Theano, Tensorflow, and Cognitive Toolkit," Journal of Intelligence and Information Systems, Vol.23, No.2(2017), 1-17. 
  3. 3. Han, H. W., "An Intelligent System Trading using Optimized CBR with Absolute Similarity Threshold," Ph.D. dissertation, The Graduate School of Business IT, Kookmin University, 2017 
  4. 4. Hong, T., T. Lee, and J. Li, "Development of Sentiment Analysis Model for the hot topic detection of online stock forums," Journal of Intelligence and Information Systems, Vol.22, No.1(2016), 187-204. 
  5. 5. Jeon, S., Y. Chung, and D. Lee, "The Relationship between Internet Search Volumes and Stock Price Changes," Journal of Intelligence and Information Systems, Vol.22, No.2(2016), 81-96. 
  6. 6. Kim, S., D. Kim, C. Han, and W. Kim, "Stock Forecasting using Stock Index Relation and Genetic Algorithm," Journal of Korean Institute of Intelligent Systems, Vol 18, No.6(2008), 781-786. 
  7. 7. Kim, S.-D., "Data Mining Tool for Stock Investors' Decision Support," Journal of The Korea Contents Association, Vol.12, No.2(2012), 472-482. 
  8. 8. Kim, S.-W., and H. Ahn, "Development of an Intelligent Trading System Using Support Vector Machines and Genetic Algorithms," Vol.16, No.1(2010), 71-92. 
  9. 9. Kim, Y., E. Shin, and T. Hong, "Comparison of Stock Price Index Prediction Performance Using Neural Networks and Support Vector Machine," The Journal of Internet Electronic Commerce Research, Vol.4, No.3(2004), 221-243. 
  10. 10. Kwon, D.-C., and B.-Y. Kang, "CPU and GPU Performance Analysis for Convolution Neural Network," The Journal of Korean Institute of Information Technology, Vol.15, No.8(2017), 11-18. 
  11. 11. LeCun, Y., L. Bottou, Y. Bengio and P. Haffner, "Gradient-based learning applied to document recognition," Proceedings of the Institute of Electrical and Electronics Engineers, Vol.86, No.11(1998), 2278-2324. 
  12. 12. LeCun, Y., Y. Bengio, and G. Hinton, "Deep learning," Nature, Vol.521, No.7553(2015), 436-444. 
  13. 13. Lee, E. J., C. H. Min, and T. S. Kim, "Development of the KOSPI (Korea Composite Stock Price Index) forecast model using neural network and statistical methods," The Institute of Electronics Engineers of Korea - Computer and Information, Vol.45, No.5(2008), 95-101. 
  14. 14. Lee, J.-D., and H. Ahn, "A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection," Journal of Intelligence and Information Systems, Vol.23, No.4(2017), 147-168. 
  15. 15. Lee, M.-S., and H. J. Lee, "Stock Price Prediction by Utilizing Category Neutral Terms : Text Mining Approach," Journal of Intelligence and Information Systems, Vol.23, No.2 (2017), 123-138. 
  16. 16. Park, J. Y., J. R, and H. J. Shin, "Predicting KOSPI Stock Index using Machine Learning Algorithms with Technical Indicators," Journal of Information Technology and Architecture, Vol.13, No.2(2016), 331-340. 
  17. 17. Roh, T. H., T. H. Lee, and I. G. Han, "Forecasting the volatility of KOSPI 200 Using Neural Network-financial Time Series Model," Korean Management Review, Vol.34, No.3 (2005), 683-713. 
  18. 18. Ryu, J. P., H. J. Shin, M. H. Kim, and J. Baek, "Pattern Analysis of Stock Prices Using Machine Learning and Data Visualization," Journal of Information Technology and Architecture, Vol.14, No.2(2017), 189-197. 
  19. 19. Srivastava, N., G. Hinton, A. Krizhevsky, I. Sutskever, and R. Salakhutdinov, "Dropout: A Simple Way to Prevent Neural Networks from Overfitting," Journal of Machine Learning Research, Vol.15, No.2(2014), 1929-1958. 
  20. 20. Torres, J., "First Contact with TensorFlow", Hanbit Media Inc., 2017. 

이 논문을 인용한 문헌 (2)

  1. 1. 장세인, 박충식 2019. "정확히 재가중되는 온라인 전체 에러율 최소화 기반의 객체 추적" 지능정보연구 = Journal of intelligence and information systems, 25(4): 53~65 
  2. 2. 조현민, 신현준 2021. "강화학습을 이용한 트레이딩 전략" 한국산학기술학회논문지 = Journal of the Korea Academia-Industrial cooperation Society, 22(1): 123~130 

문의하기 

궁금한 사항이나 기타 의견이 있으시면 남겨주세요.

Q&A 등록

원문보기

원문 PDF 다운로드

  • ScienceON :
  • KCI :

원문 URL 링크

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

이 논문과 연관된 기능

이 논문 조회수 및 차트

  • 상단의 제목을 클릭 시 조회수 및 차트가 조회됩니다.

DOI 인용 스타일

"" 핵심어 질의응답