$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

그래디언트 부스팅을 활용한 암호화폐 가격동향 예측
Prediction of Cryptocurrency Price Trend Using Gradient Boosting 원문보기

정보처리학회논문지. KIPS transactions on software and data engineering. 소프트웨어 및 데이터 공학, v.7 no.10, 2018년, pp.387 - 396  

허주성 (한국기술교육대학교 컴퓨터공학부) ,  권도형 (한국기술교육대학교 창의융합공학협동과정 ICT융합) ,  김주봉 (한국기술교육대학교 컴퓨터공학부) ,  한연희 (한국기술교육대학교 컴퓨터공학부) ,  안채헌 (한국기술교육대학교 메카트로닉스공학부)

초록
AI-Helper 아이콘AI-Helper

과거부터 주식시장의 주가 예측은 풀리지 않는 난제이다. 이를 과학적으로 예측하기 위해 다양한 시도 및 연구들이 있어왔지만 정확한 가격을 예측하는 것은 불가능하다. 최근 분산 원장이라는 개념을 기술적으로 구현한 최초의 암호화폐인 비트코인을 시작으로 다양한 종류의 암호화폐가 개발되면서 암호화폐 시장이 형성되었고, 그 가격을 예측하기 위해 다양한 접근들이 시도되고 있다. 특히, 기존의 전통적인 주식시장에서의 주가 예측 기법들을 적용하려는 시도부터 딥러닝강화학습을 적용하려는 시도까지 다양하다. 하지만 암호화폐 시장은 기존 주식 시장에는 없던 여러 가지 새로운 특징을 가지는 시장으로서 전통적인 주식 시장 분석 기술뿐만 아니라 암호화폐 시장에 적합한 새로운 분석 기술에 관한 수요가 증가하고 있는 상황이다. 본 연구에서는 우선 빗썸의 API를 통하여 7개의 암호화폐 가격 데이터를 수집 및 가공하였다. 이후, Data-Driven 방식의 지도학습 기반 기계학습 모델인 그래디언트 부스팅 모델을 채택하여 암호화폐 가격 데이터 변화를 학습하고, 검증단계에서 가장 최적의 모델 파라미터를 산출하고, 최종적으로 테스트 데이터를 활용하여 암호화폐 가격동향 예측 성능을 평가한다.

Abstract AI-Helper 아이콘AI-Helper

Stock price prediction has been a difficult problem to solve. There have been many studies to predict stock price scientifically, but it is still impossible to predict the exact price. Recently, a variety of types of cryptocurrency has been developed, beginning with Bitcoin, which is technically imp...

주제어

표/그림 (9)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서, 본 논문에서는 대표적인 기계학습 모델인 그래디언트 부스팅(Gradient Boosting) 모델을 적용해 실험을 진행한다[24]. 그래디언트 부스팅의 경우, 랜덤 포레스트보다는 매개변수 조정에 더 신경써야 한다는 단점이 있으나, 본 논문에서는 이러한 단점을 그리드 탐색(grid search) 방식을 활용하여 가장 적합한 매개변수를 찾아냄으로써 해결하고자 하였으며, 이를 통해 그래디언트 부스팅의 주요 장점인 메모리를 적게 사용하면서도 빠른 예측이 가능한 이점을 살리고자 하였다. 또한 그래디언트 부스팅 모델은 여러 머신러닝 경연 대회에서 상위권에 입상을 한 팀들이 사용한 모델이며, 최근 주식 가격 데이터 예측 모델로도 흔히 사용되고 있고 있는 보편적인 모델이라고 알려져 있다[25, 26].
  • 따라서, 본 논문에서는 기존의 전통적인 평균회귀 모델이 변동성이 매우 큰 암호화폐의 가격 예측에는 적합하지 않음에 착안하여, 그 대안으로서 기계학습 모델을 기반으로 하는 Data-Driven 방식을 활용하여 분석을 수행한다. Data-Driven 방식은 임의의 가설 기반의 모델을 세우지 않은 채 데이터분석을 시작하며, 최근 이슈가 되고 있는 기계학습 방법론을 적용하여 암호화폐 가격 동향을 예측할 수 있는 모델을 직접 구성할 수 있다는 장점이 있다.

가설 설정

  • 대표적인 Theory-Driven 모델에는 평균회귀 모델이 있다. 평균회귀 모델은 시계열 데이터가 과거의 평균값으로 회귀하려는 경향을 가지며, 관심 데이터 값들이 정규분포를 따르면서 무작위적인 특성이 없어야 함을 가정한다. 하지만, 암호화폐 가격 데이터에 대하여 Augmented Dickey-Fuller (ADF) 테스트, 허스트 지수, Half Life 등으로 평균회귀 테스트[17, 18]를 수행한 결과, ADF 테스트의 경우, 실험을 진행한 암호화폐들 전부에서 검정 통계량값이 기각값을 넘지 못하기 때문에 평균회귀 모델을 적용하기 적합하지 않으며, Hurst Coefficient 값 경우, 대부분의 암호화폐가 0.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
그래디언트 부스팅의 단점은 무엇인가? 따라서, 본 논문에서는 대표적인 기계학습 모델인 그래디언트 부스팅(Gradient Boosting) 모델을 적용해 실험을 진행한다[24]. 그래디언트 부스팅의 경우, 랜덤 포레스트보다는 매개변수 조정에 더 신경써야 한다는 단점이 있으나, 본 논문에서는 이러한 단점을 그리드 탐색(grid search) 방식을 활용하여 가장 적합한 매개변수를 찾아냄으로써 해결하고자 하였으며, 이를 통해 그래디언트 부스팅의 주요 장점인 메모리를 적게 사용하면서도 빠른 예측이 가능한 이점을 살리고자 하였다. 또한 그래디언트 부스팅 모델은 여러 머신러닝 경연 대회에서 상위권에 입상을 한 팀들이 사용한 모델이며, 최근 주식 가격 데이터 예측 모델로도 흔히 사용되고 있고 있는 보편적인 모델이라고 알려져 있다[25, 26].
블록체인은 어떤 기술인가? 암호화폐는 블록체인을 통한 분산원장기술을 이용한 디지털화폐를 말한다. 여기서 블록체인이란 거래정보가 기록된 관리 대상 데이터를 ‘블록’이라고 하는 소규모 데이터들이 P2P 방식을 기반으로 생성된 체인 형태의 연결고리 기반 분산 데이터 저장환경에 저장되어 누구도 임의로 수정할 수 없고 누구나 변경의 결과를 열람할 수 있는 분산 컴퓨팅 기술기반의 데이터 위 변조 방지 기술이다. 대표적인 암호화폐인 비트코인은 인터넷상에서 개인 대 개인(P2P) 간에 이용될 목적으로 암호체계에 기초해 설계되어, 금전적 가치가 전자적 형태로 저장되어 지급수단으로 사용되지만 정부나 중앙은행에 의해 지급이 보장되지 않는다는 점에서 기존의 법정화폐와 차이가 있다 [12].
k-NN 모델은 어떠한 경우에 잘 쓰이지 않는가? k-NN의 경우 모델 자체가 이해하기 쉬운 모델이며, 매개변수를 딱히 조정하지 않아도 좋은 성능을 발휘하는 편이다[20]. 하지만 학습 데이터셋이 클 경우에는 예측 속도가 느려서 현업에서는 잘 쓰이지 않는 모델이다. 한편, 선형 모델은 학습 속도가 빠르고 추론 또한 빠른 속도로 이루어진다는 장점이 있으며, 학습 데이터셋이 큰 경우와 희소한 데이터셋인 경우에도 비교적 정확도가 높으며, 특성 데이터가 고차원일 경우에도 비교적 그 성능이 높다고 알려져 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (29)

  1. M. S. Helen, C. Chester, A. Adam, K. Y. Dror, S. Eugene, and P. Tobias, "Quantifying Wikipedia Usage Patterns Before Stock Market Moves," Scientific Reports, May 2013. 

  2. S. Nakamoto, "Bitcoin: A Peer-to-Peer Electronic Cash System," [Internet], http://www.bitcoin.org, 2008. 

  3. R. Phillips and D. Gorse, "Predicting Cryptocurrency Price Bubbles Using Social Media Data and Epidemic Modelling," IEEE Symposium Series on Computational Intelligence, 2017. 

  4. A. Radityo, Q. Munajat, and I. Budi, "Prediction of Bitcoin exchange rate to American dollar using artificial neural network methods," International Conference on Advanced Computer Science and Information Systems, 2017. 

  5. Z. Jiang and J. Liang, "Cryptocurrency portfolio management with deep reinforcement learning," Intelligent Systems Conference, 2017. 

  6. L. Li, Y. Wu, Y. Ou, Q. Li, Y. Zhou, and D. Chen, "Research on machine learning algorithms and feature extraction for time series," The 28th IEEE Annual International Symposium on Personal, Indoor, and Mobile Radio Communications (PIMRC), Oct. 2017. 

  7. J. W. Lee, "A Stock Trading System based on Supervised Learning of Highly Volatile Stock Price Patterns," Journal of KIISE : Computing Practices and Letters, Vol.19 No.1, pp.23-29, 2013. 

  8. Y. Song, J. W. Lee, and J. Lee, "Performance Evaluation of Price-based Input Features in Stock Price Prediction using Tensorflow," KIISE Transactions on Computing Practices, Vol.23, No.11, pp.625-631, 2018. 

  9. Y. Kim, E. Shin, and T. Hong, "Comparison of Stock Price Index Prediction Performance Using Neural Networks and Support Vector Machine," The Journal of Internet Electronic Commerce Resarch, Vol.4, No.3, pp.221-243, 2004. 

  10. A. M. Ho and R. M. Hyun, "Algorithm trading system development using machine learning," Hanbit Media(Inc), Apr. 2016, ISBN: 9788968488030. 

  11. Bithumb [Internet], https://www.bithumb.com/ 

  12. T. Yook, "Change of Financial Systems by Virtual Currency or Cryptocurrency and its Legal Implications," Kangwon Law Review, Vol.53, pp.225-270, 2018. 

  13. Y. Song and J. Lee, "A Design and Implementation of Deep Learning Model for Stock Predictions using TensorFlow," Processing of Korea Information Science Society Conference, pp.799-801, June 2017. 

  14. Y. Dai and Y. Zhang, "Machine Learning in Stock Price Trend Forecasting," Stanford University, 2013. 

  15. J. W. Lee and J. M. O, "Artificial Intelligence: Integrated Multiple Simulation for Optimizing Performance of Stock Trading Systems based on Neural Networks," KIPS Journal B (2001-2012), Vol.14B, No.2, pp.127-134, Feb. 2007. 

  16. Z. Jiang, D. Xu, and J. Liang, "A Deep Reinforcement Learning Framework for the Financial Portfolio Management Problem," Journal of Machine Learning Research, arXiv:1706.10059v2, 2017. 

  17. I.-S. Baek, "Local Hurst Exponent Indicator to Sell the Abruptly Rising Stock," Korean Association of Financial Engineering, Vol.9, No.3, pp.149-165, Sept. 2010. 

  18. S. Cho and J.-S. Choi, "A Monte Carlo Experiment on the Power of Augmented Dickey-Fuller Unit Root Test," Journal of The Korean Official Statistics, Vol.10, No.1, 2005. 

  19. D.-H. Kwon, J.-S. Heo, J.-B. Kim, H.-K. Lim, and Y.-H. Han, "Correlation Analysis and Regression Test on Cryptocurrency Price Data," Proceedings of Spring Korea Information Processing Society Conference, May 2018. 

  20. P. Hall, B. U. Park, and R. J. Samworth, "Choice of Neighbor Order in Nearest-neighbor Classification," Annals of Statistics, Vol.36, No.5, pp.2135-2152, 2008. 

  21. C. J. C. Burges, "A Tutorial on Support Vector Machines for Pattern Recognition," Data Mining and Knowledge Discovery, Vol.2, No.2, pp.121-167, Jun. 1998. 

  22. Y. D. Kim, K. H. Kim, and S. H. Song, "Comparison of Boosting and SVM," Journal of the Korean Data And Information Science Sociaty, Vol.16, No.4, pp.999-1012, 2005. 

  23. J. H. Jung and D. K. Min, "The study of foreign exchange trading revenue model using decision tree and gradient boosting," Journal of the Korean Data And Information Science Society, Vol.24, No.1, pp.161-170, 2013. 

  24. Alexey Natekin and Alois Knoll "Gradient Boosting Machines, a Tutorial," Front Neurorobot, Vol.7, No.21, 2013. 

  25. S. Kar, S. Saha, L. Khaidem, and S. R. Dey, "Predicting the Direction of Stock Market Price Using Tree Based Classifiers," Elsevier North American Journal of Economics and Finance, Jul. 2018. (available online). 

  26. B. Gorman, "A Kaggle Master Explains Gradient Boosting," [Internet], http://blog.kaggle.com/2017/01/23/a-kaggle-master-explains-gradient-boosting, Jan 2017. 

  27. J. Bergstra and Y. Bengio. "Random search for hyper-parameter optimization," Journal of Machine Learning Research, Vol.13 pp.281-305, 2012. 

  28. T. Fushiki, "Estimation of prediction error by using K-fold cross-validation," Statistics and Computing, Vol.21, No.2, pp.137-146, 2011. 

  29. DASK: Scalable analytics in Python [Internet], https://dask.pydata.org/ 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로