효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market원문보기
지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.
지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.
Over the past decade, deep learning has been in spotlight among various machine learning algorithms. In particular, CNN(Convolutional Neural Network), which is known as the effective solution for recognizing and classifying images or voices, has been popularly applied to classification and predictio...
Over the past decade, deep learning has been in spotlight among various machine learning algorithms. In particular, CNN(Convolutional Neural Network), which is known as the effective solution for recognizing and classifying images or voices, has been popularly applied to classification and prediction problems. In this study, we investigate the way to apply CNN in business problem solving. Specifically, this study propose to apply CNN to stock market prediction, one of the most challenging tasks in the machine learning research. As mentioned, CNN has strength in interpreting images. Thus, the model proposed in this study adopts CNN as the binary classifier that predicts stock market direction (upward or downward) by using time series graphs as its inputs. That is, our proposal is to build a machine learning algorithm that mimics an experts called 'technical analysts' who examine the graph of past price movement, and predict future financial price movements. Our proposed model named 'CNN-FG(Convolutional Neural Network using Fluctuation Graph)' consists of five steps. In the first step, it divides the dataset into the intervals of 5 days. And then, it creates time series graphs for the divided dataset in step 2. The size of the image in which the graph is drawn is $40(pixels){\times}40(pixels)$, and the graph of each independent variable was drawn using different colors. In step 3, the model converts the images into the matrices. Each image is converted into the combination of three matrices in order to express the value of the color using R(red), G(green), and B(blue) scale. In the next step, it splits the dataset of the graph images into training and validation datasets. We used 80% of the total dataset as the training dataset, and the remaining 20% as the validation dataset. And then, CNN classifiers are trained using the images of training dataset in the final step. Regarding the parameters of CNN-FG, we adopted two convolution filters ($5{\times}5{\times}6$ and $5{\times}5{\times}9$) in the convolution layer. In the pooling layer, $2{\times}2$ max pooling filter was used. The numbers of the nodes in two hidden layers were set to, respectively, 900 and 32, and the number of the nodes in the output layer was set to 2(one is for the prediction of upward trend, and the other one is for downward trend). Activation functions for the convolution layer and the hidden layer were set to ReLU(Rectified Linear Unit), and one for the output layer set to Softmax function. To validate our model - CNN-FG, we applied it to the prediction of KOSPI200 for 2,026 days in eight years (from 2009 to 2016). To match the proportions of the two groups in the independent variable (i.e. tomorrow's stock market movement), we selected 1,950 samples by applying random sampling. Finally, we built the training dataset using 80% of the total dataset (1,560 samples), and the validation dataset using 20% (390 samples). The dependent variables of the experimental dataset included twelve technical indicators popularly been used in the previous studies. They include Stochastic %K, Stochastic %D, Momentum, ROC(rate of change), LW %R(Larry William's %R), A/D oscillator(accumulation/distribution oscillator), OSCP(price oscillator), CCI(commodity channel index), and so on. To confirm the superiority of CNN-FG, we compared its prediction accuracy with the ones of other classification models. Experimental results showed that CNN-FG outperforms LOGIT(logistic regression), ANN(artificial neural network), and SVM(support vector machine) with the statistical significance. These empirical results imply that converting time series business data into graphs and building CNN-based classification models using these graphs can be effective from the perspective of prediction accuracy. Thus, this paper sheds a light on how to apply deep learning techniques to the domain of business problem solving.
Over the past decade, deep learning has been in spotlight among various machine learning algorithms. In particular, CNN(Convolutional Neural Network), which is known as the effective solution for recognizing and classifying images or voices, has been popularly applied to classification and prediction problems. In this study, we investigate the way to apply CNN in business problem solving. Specifically, this study propose to apply CNN to stock market prediction, one of the most challenging tasks in the machine learning research. As mentioned, CNN has strength in interpreting images. Thus, the model proposed in this study adopts CNN as the binary classifier that predicts stock market direction (upward or downward) by using time series graphs as its inputs. That is, our proposal is to build a machine learning algorithm that mimics an experts called 'technical analysts' who examine the graph of past price movement, and predict future financial price movements. Our proposed model named 'CNN-FG(Convolutional Neural Network using Fluctuation Graph)' consists of five steps. In the first step, it divides the dataset into the intervals of 5 days. And then, it creates time series graphs for the divided dataset in step 2. The size of the image in which the graph is drawn is $40(pixels){\times}40(pixels)$, and the graph of each independent variable was drawn using different colors. In step 3, the model converts the images into the matrices. Each image is converted into the combination of three matrices in order to express the value of the color using R(red), G(green), and B(blue) scale. In the next step, it splits the dataset of the graph images into training and validation datasets. We used 80% of the total dataset as the training dataset, and the remaining 20% as the validation dataset. And then, CNN classifiers are trained using the images of training dataset in the final step. Regarding the parameters of CNN-FG, we adopted two convolution filters ($5{\times}5{\times}6$ and $5{\times}5{\times}9$) in the convolution layer. In the pooling layer, $2{\times}2$ max pooling filter was used. The numbers of the nodes in two hidden layers were set to, respectively, 900 and 32, and the number of the nodes in the output layer was set to 2(one is for the prediction of upward trend, and the other one is for downward trend). Activation functions for the convolution layer and the hidden layer were set to ReLU(Rectified Linear Unit), and one for the output layer set to Softmax function. To validate our model - CNN-FG, we applied it to the prediction of KOSPI200 for 2,026 days in eight years (from 2009 to 2016). To match the proportions of the two groups in the independent variable (i.e. tomorrow's stock market movement), we selected 1,950 samples by applying random sampling. Finally, we built the training dataset using 80% of the total dataset (1,560 samples), and the validation dataset using 20% (390 samples). The dependent variables of the experimental dataset included twelve technical indicators popularly been used in the previous studies. They include Stochastic %K, Stochastic %D, Momentum, ROC(rate of change), LW %R(Larry William's %R), A/D oscillator(accumulation/distribution oscillator), OSCP(price oscillator), CCI(commodity channel index), and so on. To confirm the superiority of CNN-FG, we compared its prediction accuracy with the ones of other classification models. Experimental results showed that CNN-FG outperforms LOGIT(logistic regression), ANN(artificial neural network), and SVM(support vector machine) with the statistical significance. These empirical results imply that converting time series business data into graphs and building CNN-based classification models using these graphs can be effective from the perspective of prediction accuracy. Thus, this paper sheds a light on how to apply deep learning techniques to the domain of business problem solving.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 독립변수의 일정 간격 그래프 이미지를 입력값으로 반영하여, 전통적인 기계학습 알고리즘보다 개선된 예측 정확도를 보이는 합성곱 신경망 알고리즘을 제안한다. 본 연구에서 제안하는 알고리즘은 편의상 CNN-FG (Convolutional Neural Network-based Fluctuation Graph)로 명명하였다.
본 연구에서는 예측하기 어려운 주가지수 등락 문제를 해결하기 위해서 그래프의 변동을 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 모형을 제안하였다. CNN-FG로 명명된 본 연구의 제안모형은 이미지의 인식과 분류에 뛰어나다고 알려져 있는 딥러닝의 알고리즘의 일종인 합성곱 신경망을 이용하여 주식시장에서 사용하는 주요 기술지표들의 5일 간의 변화 양상을 그래프로 만들어 그 그래프를 입력 데이터로 사용하고자 하였다.
제안 방법
본 연구에서는 예측하기 어려운 주가지수 등락 문제를 해결하기 위해서 그래프의 변동을 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 모형을 제안하였다. CNN-FG로 명명된 본 연구의 제안모형은 이미지의 인식과 분류에 뛰어나다고 알려져 있는 딥러닝의 알고리즘의 일종인 합성곱 신경망을 이용하여 주식시장에서 사용하는 주요 기술지표들의 5일 간의 변화 양상을 그래프로 만들어 그 그래프를 입력 데이터로 사용하고자 하였다. 제안모형의 주가예측 적용 가능성을 확인하고자 실제 데이터에 로지스틱 회귀분석, 인공신경망, SVM과 같은 비교모형과 제안모형을 동시에 적용해 본 결과, 제안모형이 가장 우수한 예측 정확도를 보여주었고, 그 차이는 통계적으로 유의한 것으로 확인하였다.
(2017)의 연구와 달리, 기술지표들을 입력변수로 하여 꺾은선 그래프를 그려서 만들어진 이미지 데이터를 입력데이터로 한다는 점에서 차별화된다. 구체적으로 본 연구가 제안하는 알고리즘은 먼저 입력변수들을 5일 단위로 슬라이딩 분할하여 그래프를 만들고, 만들어진 이미지 데이터를 입력변수로 하여 이미지 분류에 효과적인 성능을 보이는 합성곱 신경망에 적용하여 주가지수의 등락을 예측하는 것이다.
따라서 향후 연구에서는 영향력이 있는 독립변수의 그래프를 이용하여 주가지수의 등락을 예측하는 연구가 필요하다. 또한 주가지수에 영향을 주는 독립변수는 외부에서 발생되는 변수들도 존재하는데 내부에서 파생된 변수만을 가지고 실험을 진행하였다. 따라서 향후 연구에서는 환율, 물가지수 등 다양한 주식시장 외부변수들과 함께 실험을 진행할 필요가 있다.
본 연구에서는 독립변수의 일정 간격 그래프 이미지를 입력값으로 반영하여, 전통적인 기계학습 알고리즘보다 개선된 예측 정확도를 보이는 합성곱 신경망 알고리즘을 제안한다. 본 연구에서 제안하는 알고리즘은 편의상 CNN-FG (Convolutional Neural Network-based Fluctuation Graph)로 명명하였다. CNN-FG는 다음의 [Figure 5]에 제시된 것처럼, 총 5단계의 절차로 구현된다.
본 연구에서 제안한 CNN-FG의 알고리즘을 살펴보면 1주일 단위로 데이터 세트를 묶기 위하여 주식시장이 1주일 중 개장하는 평일 5일을 기준으로 하여, [Figure 6]와 같이 5일 단위로 데이터 세트를 슬라이딩 분할을 하였다. 따라서 총 2,026건의 데이터 세트를 통해 만들어진 그래프 이미지 데이터의 개수는 총 2,022건이 된다.
기계학습을 할 때 사용한 데이터의 양이 충분치 않아 분류기 성능측정의 통계적 신뢰도를 높이기 위해 쓰는 방법 중 k겹 교차검증(k-fold cross validation)을 사용하였다. 본 연구에서는 아래의 [Figure 10]와 같이 데이터 세트를 5개의 집단으로 나누어 4개의 집단으로 학습하고 1개의 집단으로 검증을 하는 5겹 교차검증을 사용하였다.
세번째로 독립변수 12가지에 대해서 한 이미지에 12가지의 그래프를 다 그려서 실험을 진행하였는데 각각의 독립변수의 변동 그래프가 예측 정확도에 영향을 얼마나 주는지에 대한 정밀한 검증이 없었다. 따라서 향후 연구에서는 영향력이 있는 독립변수의 그래프를 이용하여 주가지수의 등락을 예측하는 연구가 필요하다.
앞 절에서 설명한 실험설계를 통해 모형별 주가지수 등락예측 실험을 수행하였다. [Table 4]에는 실험한 모형들의 각 Fold별 가장 높은 결과를 보인 모형의 설정 값에 대한 표이다.
(2005)은 주가지수의 변동성을 예측하기 위하여 금융시계열 모형과 인공신경망 모형을 통합한 통합모형을 제시하였다. 이 연구에서는 금융시계열 모형을 바탕으로 예측하고자 하는 KOSPI200에 대한 통계적인 분석을 통해 인공신경망 모형을 위한 입력변수를 도출함으로써 예측 정확도를 향상시켰다.
제안 알고리즘의 성능을 면밀하게 확인하기 위해, 본 연구에서는 전통적인 기계학습 알고리즘과 비교하였다. 비교모형으로 선정한 모형은 로지스틱 회귀모형(logistic regression), SVM (support vector machine), 인공신경망(artificial neural network; ANN)이다.
Kim(2012)은 개인 주식 투자자의 의사결정 지원을 해주는 데이터마이닝 도구를 제안하였다. 제안한 데이터마이닝 도구의 주가예측 모형은 기술적 분석을 위해 주식시장에서 사용하는 기술지표들을 입력변수로 하는 인공신경망을 사용하였다.
종속변수는 종가 지수의 일일 변화 방향에 따라 분류하였다. ‘0’은 다음날의 종가 지수가 오늘의 지수보다 낮고 ‘1’은 다음날의 지수가 오늘의 지수보다 높다는 것을 의미한다.
대상 데이터
이 단계에서는 3단계에서 만들어진 이미지별 행렬 데이터들을 입력 데이터 세트로 하여, CNN-FG의 일반화 정도를 측정하기 위하여 학습용과 검증용 데이터 세트로 구분한다. 데이터 세트의 구성은 8:2의 비율로 하여 전체의 80%를 차지하는 데이터를 학습용으로 사용하였고, 전체의 20%를 검증용으로 사용하였다.
지난 2007년 미국에서 시작된 서브프라임 모기지 사태(subprime mortgage crisis)는 국제 금융 시장에 대규모의 금융위기를 야기하였기 때문에 2007~2008년의 주식시장 데이터는 2007년 이전과 2008년 이후와는 상당히 다른 패턴을 보이는 이상치에 가깝다. 따라서 본 연구에서는 글로벌 위기가 해소되기 시작한 2009년부터 시작되는 데이터를 사용하였다(Han, 2017).
com/finance)에서 제공하는 일별 KOSPI200 주가 지수를 사용하였다. 모형 구축을 위해 사용한 표본 데이터는 2009년 1월부터 2017년 2월까지 약 8년간 발생한 2,026건의 KOSPI200의 일별 주가지수이다. 지난 2007년 미국에서 시작된 서브프라임 모기지 사태(subprime mortgage crisis)는 국제 금융 시장에 대규모의 금융위기를 야기하였기 때문에 2007~2008년의 주식시장 데이터는 2007년 이전과 2008년 이후와는 상당히 다른 패턴을 보이는 이상치에 가깝다.
본 연구에서 제안하는 CNN-FG의 유용성을 검증하기 위해 구글 파이낸스(Google Finance , https://www.google.com/finance)에서 제공하는 일별 KOSPI200 주가 지수를 사용하였다. 모형 구축을 위해 사용한 표본 데이터는 2009년 1월부터 2017년 2월까지 약 8년간 발생한 2,026건의 KOSPI200의 일별 주가지수이다.
제안 알고리즘의 성능을 면밀하게 확인하기 위해, 본 연구에서는 전통적인 기계학습 알고리즘과 비교하였다. 비교모형으로 선정한 모형은 로지스틱 회귀모형(logistic regression), SVM (support vector machine), 인공신경망(artificial neural network; ANN)이다.
데이터처리
기계학습을 할 때 사용한 데이터의 양이 충분치 않아 분류기 성능측정의 통계적 신뢰도를 높이기 위해 쓰는 방법 중 k겹 교차검증(k-fold cross validation)을 사용하였다. 본 연구에서는 아래의 [Figure 10]와 같이 데이터 세트를 5개의 집단으로 나누어 4개의 집단으로 학습하고 1개의 집단으로 검증을 하는 5겹 교차검증을 사용하였다.
이어서 제안 모형과 비교 모형들 간의 예측 정확도의 차이가 통계적으로 유의한지를 확인하기 위해 Two-Sample Test for Proportions를 실시하였다. 그 결과 아래의 [Table 6]와 같이 본 연구에서 제안한 CNN-FG는 로지스틱 회귀분석과 99%, 인공신경망과 95%, SVM과 95% 신뢰 수준 하에서 통계적으로 유의한 차이를 보이고 있다.
이론/모형
CNN-FG의 신경망을 구성하기 위해 텐서플로우(TensorFlow)를 활용하여 알고리즘을 구현하였다. 텐서플로우는 2015년 구글 브레인 팀에서 오픈 소스로 공개한 머신 러닝 시스템으로써 파이썬(python) 라이브러리의 형태로 문법이 개발되어 있는 딥러닝 프레임워크이다(Chung et al.
본 연구에서 사용된 입력변수는 기술적 분석 전문가들의 관련 연구 검토를 통해 [Table 2]과 같이 주식시장에서 사용하는 12가지 기술지표를 선택하였다(Ahn and Kim, 2008).
(2004)은 입력변수로 가격변화를 나타내는 Momentum, ROC와 주가의 전환점을 알려주는 %K, %D, Slow %D, CCI, ROC와 장기간의 추세경향을 알아보는 Linear Slope, LU/LD와 이동평균을 나타내는 MACD, WARS 등 기술적 지표를 활용하여 주가지수의 등락을 예측하고자 하였다. 이 때 분류모형으로는 인공신경망과 SVM을 활용하였다.
(2017)은 주식시장에 상장된 주식을 대상으로 일별 시가, 저가, 고가, 종가 등을 포함한 총 26가지의 기술적 지표를 바탕으로 방사형 차트를 그려서 주가 패턴을 클러스터화하고, 데이터 시각화를 통하여 각 패턴의 유형을 분석하는 연구를 하였다. 이 때 클러스터링의 방법론은 자기조직화지도(self organizing map, SOM)을 이용하였다.
성능/효과
이어서 제안 모형과 비교 모형들 간의 예측 정확도의 차이가 통계적으로 유의한지를 확인하기 위해 Two-Sample Test for Proportions를 실시하였다. 그 결과 아래의 [Table 6]와 같이 본 연구에서 제안한 CNN-FG는 로지스틱 회귀분석과 99%, 인공신경망과 95%, SVM과 95% 신뢰 수준 하에서 통계적으로 유의한 차이를 보이고 있다. 따라서 제안 모형과 비교 모형들 간의 예측 정확도의 차이가 통계적으로 유의함을 확인할 수 있다.
그 결과 아래의 [Table 6]와 같이 본 연구에서 제안한 CNN-FG는 로지스틱 회귀분석과 99%, 인공신경망과 95%, SVM과 95% 신뢰 수준 하에서 통계적으로 유의한 차이를 보이고 있다. 따라서 제안 모형과 비교 모형들 간의 예측 정확도의 차이가 통계적으로 유의함을 확인할 수 있다.
74%로 기존 기법들에 비해 개선된 예측 정확도를 보이는 것을 확인하였다. 또한 학습용 데이터 세트와 검증용 데이터 세트에 대한 모형 간의 예측 정확도 차이가 적어서 상당히 안정된 결과를 보여주었다. 이를 통해 그래프 이미지를 입력 데이터로 하는 합성곱 신경망을 이용한 주가지수 등락 예측모형구축은 효과적임을 증명하였다.
Kim and Ahn(2010)은 기존 연구들에서 등락의 기준으로 삼는 단일 임계치가 아닌 이중 임계치를 유전자 알고리즘을 이용하여 최적화하고 SVM을 이용하여 주가지수의 등락을 예측하여 트레이딩 시스템의 매수, 매도, 유지의 신호로 해석하는 지능형 트레이딩 시스템을 제안하였다. 수익률 관점에서 다른 모형들과 비교한 결과 더 우수한 모형임을 확인하였다.
[Table 5]는 제안 모형인 CNN-FG과 로지스틱 회귀분석, 인공신경망, SVM의 총 4가지의 비교모형 실험결과를 종합한 표이다. 실험 결과에 따르면 제안 모형의 예측 정확도가 평균 57.74%로 기존 기법들에 비해 개선된 예측 정확도를 보이는 것을 확인하였다. 또한 학습용 데이터 세트와 검증용 데이터 세트에 대한 모형 간의 예측 정확도 차이가 적어서 상당히 안정된 결과를 보여주었다.
(2008)은 22개의 표준기본경제지표로부터 통계적 분석을 통해 12개의 경제지표를 추출하고, 추출된 경제지표들을 예측하고자 하는 예측일에 따라 최량부분적합법을 이용하여 다시 한 번 입력변수들을 선정하였다. 이러한 입력변수를 바탕으로 인공신경망을 통해 주가지수를 예측하고자 하였는데, 제안된 방법이 전통적인 방법보다 우수함을 실증 분석하였다.
또한 학습용 데이터 세트와 검증용 데이터 세트에 대한 모형 간의 예측 정확도 차이가 적어서 상당히 안정된 결과를 보여주었다. 이를 통해 그래프 이미지를 입력 데이터로 하는 합성곱 신경망을 이용한 주가지수 등락 예측모형구축은 효과적임을 증명하였다.
CNN-FG로 명명된 본 연구의 제안모형은 이미지의 인식과 분류에 뛰어나다고 알려져 있는 딥러닝의 알고리즘의 일종인 합성곱 신경망을 이용하여 주식시장에서 사용하는 주요 기술지표들의 5일 간의 변화 양상을 그래프로 만들어 그 그래프를 입력 데이터로 사용하고자 하였다. 제안모형의 주가예측 적용 가능성을 확인하고자 실제 데이터에 로지스틱 회귀분석, 인공신경망, SVM과 같은 비교모형과 제안모형을 동시에 적용해 본 결과, 제안모형이 가장 우수한 예측 정확도를 보여주었고, 그 차이는 통계적으로 유의한 것으로 확인하였다.
후속연구
향후 연구에서는 시계열에 대한 분석에 효과적인 딥러닝의 일종인 순환 신경망(recurrent neural network; RNN)과 같은 기계학습 알고리즘과의 정밀한 비교모형실험이 필요하다.
그러므로 향후 연구에서는 합성곱 신경망 알고리즘을 다양한 조건에서 실험해보고 입력 데이터에 따른 최적의 설계 조건을 찾아보는 연구가 필요하다.
마지막으로 본 연구의 제안모형은 주가지수 등락예측이라는 특정분야에 대해서만 실험이 진행되었기 때문에 그래프의 변동성을 가지고 예측을 하는 알고리즘의 일반성이 충분히 검증되지 못하였다. 따라서 사람의 감정변화에 대한 그래프나 기존에 다른 시계열 비즈니스 문제에서 사용한 독립변수들에 대한 그래프와 같은 다양한 분야에서 제안모형의 일반성을 검증하는 것이 향후 연구과제가 될 수 있을 것이다.
세번째로 독립변수 12가지에 대해서 한 이미지에 12가지의 그래프를 다 그려서 실험을 진행하였는데 각각의 독립변수의 변동 그래프가 예측 정확도에 영향을 얼마나 주는지에 대한 정밀한 검증이 없었다. 따라서 향후 연구에서는 영향력이 있는 독립변수의 그래프를 이용하여 주가지수의 등락을 예측하는 연구가 필요하다. 또한 주가지수에 영향을 주는 독립변수는 외부에서 발생되는 변수들도 존재하는데 내부에서 파생된 변수만을 가지고 실험을 진행하였다.
또한 주가지수에 영향을 주는 독립변수는 외부에서 발생되는 변수들도 존재하는데 내부에서 파생된 변수만을 가지고 실험을 진행하였다. 따라서 향후 연구에서는 환율, 물가지수 등 다양한 주식시장 외부변수들과 함께 실험을 진행할 필요가 있다.
4장에서는 본 연구의 실증분석을 위한 데이터, 실험설계 그리고 실험결과에 대해 논의한다. 마지막으로 5장에서는 본 연구의 결론과 함께 본 연구가 갖는 의의와 한계점, 향후 연구방향을 제시할 것이다.
마지막으로 본 연구의 제안모형은 주가지수 등락예측이라는 특정분야에 대해서만 실험이 진행되었기 때문에 그래프의 변동성을 가지고 예측을 하는 알고리즘의 일반성이 충분히 검증되지 못하였다. 따라서 사람의 감정변화에 대한 그래프나 기존에 다른 시계열 비즈니스 문제에서 사용한 독립변수들에 대한 그래프와 같은 다양한 분야에서 제안모형의 일반성을 검증하는 것이 향후 연구과제가 될 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
합성곱 신경망이란 무엇인가?
딥러닝 알고리즘의 일종인 합성곱 신경망(convolutional neural network, CNN)은 패턴이나 물체를 인식하는 생물의 시각처리과정을 모방한 모형으로써 LeCun et al.(1998)에 의해 합성곱 신경망이 발전하는 계기가 되었다.
주가지수 예측을 위한 방법에는 무엇이 있는가?
주가지수 예측을 위한 방법으로는 회사의 가치를 분석하여 현재 시장가격과의 차이를 밝혀 향후 가격을 예측하는 기본적 분석기법과 시간 변화에 따른 시장가격 변동을 연구하여 패턴을 찾아내고 향후 가격을 예측하는 기술적 분석기법이 있다. 그러나 주식시장에서 발생하는 예측하기 어려운 다양한 변수들로 인해 예측 정확성은 뛰어나지 못하다.
현업에서 주가예측을 하기 위해 무엇을 하고 있는가?
주가예측은 주식시장에서 발생하는 다양한 요인들로 인해 예측하기 어려운 문제 중 하나이다. 현업에서는 이른바 기술적 분석 전문가들이 과거의 주가지수나 거래량 등 주식시장에서 나타나는 데이터와 차트를 분석하여 주가동향과 투자심리 등을 예측하려고 시도하고 있다. 학계에서는 인공신경망, SVM(support vector machine) 등 전통적인 기계학습 알고리즘을 이용하여 주식시장에서 기술적 분석을 위해 사용하는 기술지표들을 입력변수로 사용하여 주식시장을 예측하려는 연구들이 주로 발표되어 왔다(Kim et al.
참고문헌 (20)
Ahn, H. and K.-j. Kim, "Using genetic algorithms to optimize nearest neighbors for data mining," Annals of Operations Research, Vol.163, No.1(2008), 5-18.
Chung, Y., S.M. Ahn., J. Yang, and J. Lee, "Comparison of Deep Learning Frameworks: About Theano, Tensorflow, and Cognitive Toolkit," Journal of Intelligence and Information Systems, Vol.23, No.2(2017), 1-17.
Han, H. W., "An Intelligent System Trading using Optimized CBR with Absolute Similarity Threshold," Ph.D. dissertation, The Graduate School of Business IT, Kookmin University, 2017
Hong, T., T. Lee, and J. Li, "Development of Sentiment Analysis Model for the hot topic detection of online stock forums," Journal of Intelligence and Information Systems, Vol.22, No.1(2016), 187-204.
Jeon, S., Y. Chung, and D. Lee, "The Relationship between Internet Search Volumes and Stock Price Changes," Journal of Intelligence and Information Systems, Vol.22, No.2(2016), 81-96.
Kim, S., D. Kim, C. Han, and W. Kim, "Stock Forecasting using Stock Index Relation and Genetic Algorithm," Journal of Korean Institute of Intelligent Systems, Vol 18, No.6(2008), 781-786.
Kim, S.-W., and H. Ahn, "Development of an Intelligent Trading System Using Support Vector Machines and Genetic Algorithms," Vol.16, No.1(2010), 71-92.
Kim, Y., E. Shin, and T. Hong, "Comparison of Stock Price Index Prediction Performance Using Neural Networks and Support Vector Machine," The Journal of Internet Electronic Commerce Research, Vol.4, No.3(2004), 221-243.
Kwon, D.-C., and B.-Y. Kang, "CPU and GPU Performance Analysis for Convolution Neural Network," The Journal of Korean Institute of Information Technology, Vol.15, No.8(2017), 11-18.
LeCun, Y., L. Bottou, Y. Bengio and P. Haffner, "Gradient-based learning applied to document recognition," Proceedings of the Institute of Electrical and Electronics Engineers, Vol.86, No.11(1998), 2278-2324.
Lee, E. J., C. H. Min, and T. S. Kim, "Development of the KOSPI (Korea Composite Stock Price Index) forecast model using neural network and statistical methods," The Institute of Electronics Engineers of Korea - Computer and Information, Vol.45, No.5(2008), 95-101.
Lee, J.-D., and H. Ahn, "A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection," Journal of Intelligence and Information Systems, Vol.23, No.4(2017), 147-168.
Lee, M.-S., and H. J. Lee, "Stock Price Prediction by Utilizing Category Neutral Terms : Text Mining Approach," Journal of Intelligence and Information Systems, Vol.23, No.2 (2017), 123-138.
Park, J. Y., J. R, and H. J. Shin, "Predicting KOSPI Stock Index using Machine Learning Algorithms with Technical Indicators," Journal of Information Technology and Architecture, Vol.13, No.2(2016), 331-340.
Roh, T. H., T. H. Lee, and I. G. Han, "Forecasting the volatility of KOSPI 200 Using Neural Network-financial Time Series Model," Korean Management Review, Vol.34, No.3 (2005), 683-713.
Ryu, J. P., H. J. Shin, M. H. Kim, and J. Baek, "Pattern Analysis of Stock Prices Using Machine Learning and Data Visualization," Journal of Information Technology and Architecture, Vol.14, No.2(2017), 189-197.
Srivastava, N., G. Hinton, A. Krizhevsky, I. Sutskever, and R. Salakhutdinov, "Dropout: A Simple Way to Prevent Neural Networks from Overfitting," Journal of Machine Learning Research, Vol.15, No.2(2014), 1929-1958.
Torres, J., "First Contact with TensorFlow", Hanbit Media Inc., 2017.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.