$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

재무예측을 위한 Support Vector Machine의 최적화
Optimization of Support Vector Machines for Financial Forecasting 원문보기

지능정보연구 = Journal of intelligence and information systems, v.17 no.4, 2011년, pp.241 - 254  

김경재 (동국대학교_서울 경영정보학과) ,  안현철 (국민대학교 경영정보학부)

초록
AI-Helper 아이콘AI-Helper

Support vector machines(SVM)은 비교적 최근에 등장한 데이터마이닝 기법이지만, 재무, CRM 등의 경영학 분야에서 많이 연구되고 있다. SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다. 본 연구에서 제안하는 모형은 사례선택기법을 일반적인 SVM에 융합한 것으로 대용량의 데이터에서 예측에 불필요한 데이터를 선별적으로 제거하여 예측의 정확도와 속도를 제고할 수 있는 방법이다. 본 연구에서는 잡음이 많고 예측이 어려운 것으로 알려진 재무 데이터를 활용하여 제안 모형의 유용성을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

Financial time-series forecasting is one of the most important issues because it is essential for the risk management of financial institutions. Therefore, researchers have tried to forecast financial time-series using various data mining techniques such as regression, artificial neural networks, de...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구에서는 SVM에 유전자 알고리즘을 적용하기 위하여 전체 실험자료에 대해 각각 분석에서의 사용여부를 나타내는 코드를 부여하고 이를 조합하여 모집단 염색체를 구성한 다음, 유전자 알고리즘 고유의 연산과정인 교배, 선택, 돌연변이 조작과 이에 따른 산출물인 적합도 평가를 하게 된다. 즉, 전체 원자료 중에서 여러 조합을 이용하여 SVM에서 사용될 실험 데이터를 선택적으로 재구성하고, 이 중에서 적합도 함수의 평가결과가 가장 우수한 자료의 집합을 최종적으로 선택하여 사례 선택을 하는 방식이다.
  • 본 연구에서는 사례기반추론이나 인공신경망에서의 사례선택에 성공적으로 이용된 유전자 알고리즘 기반의 사례선택기법을 활용하여 예측성능이 매우 우수한 것으로 알려져 최근 많은 연구에서 이용되고 있는 SVM에 적용하고자 한다. 이는 Reeves and Taylor(1998), Reeves and Bush(2001), Kim(2006)의 연구에서 제안된 방법을 SVM에 응용하는 것이라 할 수 있다.
  • 본 연구에서는 예측정확도 제고라는 목적을 가지고 있으므로 Wrapper model을 이용한 전처리를 통하여 양이 많고 잡음이 심한 주식시장 데이터에서의 예측을 위한 새로운 방법을 제안한다. 제안하는 방법은 데이터마이닝을 이용한 분석과정에서 예측정확도를 보다 제고할 수 있도록 분석에 사용될 데이터를 선택적으로 활용하는 방법이다.
  • 본 연구에서는 유전자 알고리즘에 기반한 사례 선택기법이라는 새로운 데이터마이닝 기법을 전통적인 데이터마이닝 기법인 SVM에 결합한 새로운 SVM 기법을 제안하였다. 본 연구에서 제안한 모형은 유전자 알고리즘을 활용하여 일반적인 SVM 모형의 예측성과를 제고할 수 있는 학습용 데이터를 선택적으로 활용함으로써 예측성과를 저하시키는 데이터들을 사전적으로 데이터 집합으로부터 제거할 수 있으며 이를 통하여 예측의 효율성과 효과성을 제고할 수 있었다.
  • 본 연구에서의 유전자 알고리즘 수행 목적은 주식시장의 미래 방향을 예측하는 데에 유용하며 SVM 내에서 활용할 학습용 자료의 집합을 선택하는 것이다. 예측에 사용할 전체 데이터는 매우 많으며, 이들 데이터를 모두 SVM 분석과정에 사용한다면 소요되는 분석시간도 많이 필요하고, 불필요하거나 중복된 데이터 또는 잡음이 심한 데이터로 인해 효과적이지 못한 분석결과를 제시할 가능성이 높다.
  • 최근에는 경영학 분야에 SVM을 응용하고자 하는 연구들이 많이 진행되고 있는데 특히, 재무분야에 적용한 연구로는 주로 시계열 예측 및 분류에 관한 것이었다(Tay and Cao, 2001, Kim, 2003, 안현철 등, 2006, 안현철, 김경재, 2009). 이 연구들에서는 전형적인 SVM 모형의 재무예측에의 유용성을 평가하거나, 채권평가의 분야에서 일반적인 이분류 SVM을 대체하는 다분류 SVM의 여러 모형들의 예측가능성을 검증한 것이었다. 그러나 선행연구에서는 대부분 일반적인 SVM 알고리즘에 대한 수정 없이 응용분야에 맞는 SVM의 모수 결정이나 기존 데이터마이닝 기법과의 성능 비교에 치중하였다.
  • 본 연구에서 제안하는 유전자 알고리즘에 기반한 사례선택 기법은 일반적인 사례선택 기법을 이용한 선행연구에서와 같이 대용량 데이터를 이용하면서도 정확한 의사결정지원을 할 수 있도록 설계되어야 한다. 이러한 목표는 분석에 사용되는 데이터마이닝 기법의 목적함수와 유전자 알고리즘의 적합도함수를 일치시키고 유전자 알고리즘이 적합도함수를 최적화하기 위해 탐색할 공간을 전체 원데이터로 설정함으로써 구현할 수 있다.

가설 설정

  • 이 검정에서, i = 1, …, n이고 j = 2, …, m일 때, 귀무가설은 H0:pi-pj =0이고, 대립 가설은 Ha:pi-pj > 0이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
SVM의 특징은? SVM은 입력공간과 관련된 비선형문제를 고차원의 특징공간에서의 선형문제로 변환시켜 나타내기 때문에 수학적으로 분석하는 것이 수월하다는 점이 특징이다(Vapnik, 1995, 1998). 다른 데이터마이닝 기법에 비하여 SVM은 조정해야 할 모수의 수가 많지 않아 비교적 쉽게 학습에 영향을 미치는 요인들을 규명할 수 있고, 구조적위험을 최소화하여 과도적합문제에서 벗어날 가능성이 크며, 볼록함수를 최소화하는 학습을 진행하여 전역 최적해를 찾을 가능성이 크다는 점이 장점이다.
일반적인 SVM을 이용하려면 임의성이 높고, 국부 최적해에 수렴할 가능성이 큰 이유는? SVM은 인공신경망과 필적할 만큼의 예측 정확도를 보이는 사례가 많았지만, 암상자로 불리는 인공신경망 모형에 비해 구축된 예측모형의 구조를 이해하기 쉽고, 인공신경망에 비해 과도적합의 가능성이 적어서 적은 수의 데이터에서도 적용 가능하다는 장점을 가지고 있다. 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다.
SVM을 사용하려고 할때, 잡음이 심한 데이터가 포함된 경우 어떤 문제를 일으킬 가능성이 있는가? 하지만, 일반적인 SVM을 이용하려면, 인공신경망과 마찬가지로 여러 가지 설계요소들을 설계자가 선택하여야 하기 때문에 임의성이 높고, 국부 최적해에 수렴할 가능성도 크다. 또한, 많은 수의 데이터가 존재하는 경우에는 데이터를 분석하고 이용하는데 시간이 소요되고, 종종 잡음이 심한 데이터가 포함된 경우에는 기대하는 수준의 예측성과를 얻지 못할 가능성이 있다. 본 연구에서는 일반적인 SVM의 장점을 그대로 유지하면서, 전술한 두 가지 단점을 보완한 새로운 SVM 모형을 제안한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (22)

  1. 안현철, 김경재, "다양한 다분류 SVM을 적용한 기업채권평가", Asia Pacific Journal of Information Systems, 19권 2호(2009), 157-178 

  2. 안현철, 김경재, 한인구, "다분류 Support Vector Machine을 이용한 한국 기업의 지능형 기업 채권평가모형", 경영학연구, 35권 5호(2006), 1479-1496. 

  3. Ahn, H. and K. Kim, "Using genetic algorithms to optimize k-nearest neighbors for data mining", Annals of Operations Research, Vol.163, No.1(2008), 5-18. 

  4. Chang, C.-C. and C.-J Lin, LIBSVM:a library for support vector machines, Software available at http://www.csie.ntu.edu.tw/~cjlin/ libsvm, 2001 

  5. Gates, G. W., "The reduced nearest neighbor rule", IEEE Transactions on Information Theory, Vol.18, No.3(1972), 431-433. 

  6. Harnett, D. L., A. K. Soni, Statistical methods for business and economics, Addison-Wesley, MA, 1991 

  7. Hart, P. E., "The condensed nearest neighbor rule", IEEE Transactions on Information Theory, Vol.14(1968), 515-516. 

  8. Kim, K., "Financial time series forecasting using support vector machines", Neurocomputing, Vol.55(2003), 307-319. 

  9. Kim, K., "Artificial neural networks with evolutionary instance selection for financial forecasting", Expert Systems with Applications, Vol.30, No.3(2006), 519-526. 

  10. Kuncheva, L. I., "'Change-glasses' approach in pattern recognition", Pattern Recognition Letters, Vol.14(1993), 619-623. 

  11. Liu, H. and H. Motoda, "Feature transformation and subset selection", IEEE Intelligent Systems, Vol.13, No.2(1998), 26-28. 

  12. McSherry, D., "Automating case selection in the construction of a case library", Knowledge Based Systems, Vol.13, No.2/3(2000), 133- 140. 

  13. Reeves, C. R. and D. R. Bush, Using genetic algorithms for training data selection in RBF networks, In Liu, H. and H. Motoda, Instance selection and construction for data mining, Kluwer Academic Publishers, Massachusetts, (2001), 339-356. 

  14. Reeves, C. R. and S. J. Taylor, Selection of training sets for neural networks by a genetic algorithm, In Eiden, A. E., T. Back, M. Schoenauer and H.-P. Schwefel, Parallel problem-solving from nature-PPSN V, Springer-Verlag, Berlin, 1998. 

  15. Ritter, G. L., H. B. Woodruff, S. R. Lowry, and T. L. Isenhour, "An algorithm for a selective nearest neighbor decision rule", IEEE Transactions on Information Theory, Vol.21, No.6(1975), 665-669. 

  16. Smyth, B., "Case-base maintenance", Proceedings of the 11th International Conference on Industrial and Engineering Applications of Artificial Intelligence and Expert Systems, (1998), 507-516. 

  17. Tay, F. E. H. and L. Cao, "Application of support vector machines in financial time series forecasting", Omega, Vol.29(2001), 309-317. 

  18. Tetko, I. V. and A. E. P. Villa, "Efficient partition of learning data sets for neural network training", Neural Networks, Vol.10, No.8 (1997), 1361-1374. 

  19. Vapnik, V. N., The Nature of Statistical Learning Theory, Springer-Verlag, 1995 

  20. Vapnik, V. N., Statistical Learning Theory, Wiley, New York, 1998 

  21. Wilson, D. L., "Asymptotic properties of nearest neighbor rules using edited data", IEEE Transactions on Systems, Man, and Cybernetics, Vol.2, No.3(1972), 408-421. 

  22. Wilson, D. R. and T. R. Martinez, "Reduction techniques for instance-based learning algorithms", Machine Learning, Vol.38(2000), 257-286. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로