일상적인 개인의 생활, 기업의 경영, 국가의 경제에 매 순간마다 정확한 의사결정에 있어서 정확한 정보가 필수사항이다. 또한, 다양한 환경에서 접하게 되는 정보는 각양각색의 환경적 특수성과 요인들에 의해 시시각각 변화되어 예측이 어려운 비정상 시계열 자료가 대부분이다. 특히, 금융 및 경제에 관련된 데이터들은 잡음이 많고, AI와 빅데이터의 기술의 발달로 빠르게 변화하는 변동성으로 단편적인 모델로 구성된 예측 방법으로는 신속하고 정확한 예측을 하기 어려운 환경에 처하여 있다. 그러한 이유로 여러 선행연구를 고찰한 결과 정확한 의사결정을 위하여 밀접하게 접하고 있는 경제, 경영 등의 시계열 자료에서 필요한 자료를 정확하게 예측하는 ...
일상적인 개인의 생활, 기업의 경영, 국가의 경제에 매 순간마다 정확한 의사결정에 있어서 정확한 정보가 필수사항이다. 또한, 다양한 환경에서 접하게 되는 정보는 각양각색의 환경적 특수성과 요인들에 의해 시시각각 변화되어 예측이 어려운 비정상 시계열 자료가 대부분이다. 특히, 금융 및 경제에 관련된 데이터들은 잡음이 많고, AI와 빅데이터의 기술의 발달로 빠르게 변화하는 변동성으로 단편적인 모델로 구성된 예측 방법으로는 신속하고 정확한 예측을 하기 어려운 환경에 처하여 있다. 그러한 이유로 여러 선행연구를 고찰한 결과 정확한 의사결정을 위하여 밀접하게 접하고 있는 경제, 경영 등의 시계열 자료에서 필요한 자료를 정확하게 예측하는 시계열 예측 연구의 중요성이 높아가고 있다. 그러나, 여러 분야에서 다양한 변수들이 영향을 미치고 있지만 모든 변수를 포용 하기에는 한계가 있기 때문에 제한된 변수만으로 정확한 예측이 필요한 실정이다. 이에 선행연구의 고찰을 근거로 다음과 같은 연구의 목적을 설정 하였다. 첫째, 융합적 실증분석 모델을 도출하고 도출된 모델에 적합한 방법론을 활용하여 시계열 자료의 특징을 분해한 후, 시계열 특징에 따른 분석과 절차에 따라 정확한 예측을 실현하는 것이다. 둘째, 각 시계열 자료의 특징별로 분류된 처리 방법에 따른 예측 성능의 효율성을 실험을 통하여 비교 및 검증하는 것이다. 셋째, 비정상 시계열과 비선형의 특성을 가진 자료를 신호 처리에 사용되는 디노이징 필터를 활용한 신속하고 정확한 예측 결과를 얻는 것이다. 본 논문에서는 코스피지수의 예측을 위해 20년간의 일간 데이터를 수집하여 시계열의 효율적인 특징 분석에 필요한 승법적 시계열 요소 분해법과 시계열 자료의 이산 웨이블릿 변환의 디노이징 선택이 예측의 정확성 향상에 미치는 영향을 파악하기 위하여 두가지 기법을 도입 하였다. 추세 성분을 제외한 나머지 성분과 원자료를 이산 웨이블릿 변환 과정에서 7가지 종류의 다양한 웨이블릿으로 잡음제거(denoising)를 수행하여 시계열 예측의 정확성을 비교하고 양방향 LSTM과 ARIMA 모델에 적용하는 시점에 어떤 예측 도구에 더 잘 적합하는지에 관하여 비교한 실험을 하였다. 이러한 예측의 정확성에 관한 문제에 있어서 훈련 및 테스트 과정에서 자주 발생되는 과접합(overfitting) 또는 과소접합(underfit) 및 적은 데이터로 발생되는 문제들을 회피하기 위한 시스템이 구성이 필요하여 교차검증(Cross-Validation) 방법론을 본 논문의 실증분석모델에 적합하여 예측의 정확성을 확장 하였다. 특히, 시계열 교차검증 방법론 중에서 Forward-Chaining과 Rolling-origin-recalibration 기반인 Day Forward-Chaining 기법의 변형을 모형화하여 본 실증분석 실험에 도입 하였다. 그리고, 서로 다른 두 모델의 융합한 결합예측의 성능을 향상하기 위한 가중치 추정에 대한 방법을 단순평균, 가중치 비율조정, 통상 최소제곱(OLS), 릿지회귀(Ridge regression)에서 가중치를 추정하여 결합예측오차를 비교 하였다. 본 연구의 실증분석은 전통적 통계방법론과 최근 예측 방법론의 융합적 시스템이 해결해야 하는 많은 문제들에 앞에 있어서 좋은 모델로 승화되어 향후 빅데이터 관련한 도움이 될 것이다.
일상적인 개인의 생활, 기업의 경영, 국가의 경제에 매 순간마다 정확한 의사결정에 있어서 정확한 정보가 필수사항이다. 또한, 다양한 환경에서 접하게 되는 정보는 각양각색의 환경적 특수성과 요인들에 의해 시시각각 변화되어 예측이 어려운 비정상 시계열 자료가 대부분이다. 특히, 금융 및 경제에 관련된 데이터들은 잡음이 많고, AI와 빅데이터의 기술의 발달로 빠르게 변화하는 변동성으로 단편적인 모델로 구성된 예측 방법으로는 신속하고 정확한 예측을 하기 어려운 환경에 처하여 있다. 그러한 이유로 여러 선행연구를 고찰한 결과 정확한 의사결정을 위하여 밀접하게 접하고 있는 경제, 경영 등의 시계열 자료에서 필요한 자료를 정확하게 예측하는 시계열 예측 연구의 중요성이 높아가고 있다. 그러나, 여러 분야에서 다양한 변수들이 영향을 미치고 있지만 모든 변수를 포용 하기에는 한계가 있기 때문에 제한된 변수만으로 정확한 예측이 필요한 실정이다. 이에 선행연구의 고찰을 근거로 다음과 같은 연구의 목적을 설정 하였다. 첫째, 융합적 실증분석 모델을 도출하고 도출된 모델에 적합한 방법론을 활용하여 시계열 자료의 특징을 분해한 후, 시계열 특징에 따른 분석과 절차에 따라 정확한 예측을 실현하는 것이다. 둘째, 각 시계열 자료의 특징별로 분류된 처리 방법에 따른 예측 성능의 효율성을 실험을 통하여 비교 및 검증하는 것이다. 셋째, 비정상 시계열과 비선형의 특성을 가진 자료를 신호 처리에 사용되는 디노이징 필터를 활용한 신속하고 정확한 예측 결과를 얻는 것이다. 본 논문에서는 코스피지수의 예측을 위해 20년간의 일간 데이터를 수집하여 시계열의 효율적인 특징 분석에 필요한 승법적 시계열 요소 분해법과 시계열 자료의 이산 웨이블릿 변환의 디노이징 선택이 예측의 정확성 향상에 미치는 영향을 파악하기 위하여 두가지 기법을 도입 하였다. 추세 성분을 제외한 나머지 성분과 원자료를 이산 웨이블릿 변환 과정에서 7가지 종류의 다양한 웨이블릿으로 잡음제거(denoising)를 수행하여 시계열 예측의 정확성을 비교하고 양방향 LSTM과 ARIMA 모델에 적용하는 시점에 어떤 예측 도구에 더 잘 적합하는지에 관하여 비교한 실험을 하였다. 이러한 예측의 정확성에 관한 문제에 있어서 훈련 및 테스트 과정에서 자주 발생되는 과접합(overfitting) 또는 과소접합(underfit) 및 적은 데이터로 발생되는 문제들을 회피하기 위한 시스템이 구성이 필요하여 교차검증(Cross-Validation) 방법론을 본 논문의 실증분석모델에 적합하여 예측의 정확성을 확장 하였다. 특히, 시계열 교차검증 방법론 중에서 Forward-Chaining과 Rolling-origin-recalibration 기반인 Day Forward-Chaining 기법의 변형을 모형화하여 본 실증분석 실험에 도입 하였다. 그리고, 서로 다른 두 모델의 융합한 결합예측의 성능을 향상하기 위한 가중치 추정에 대한 방법을 단순평균, 가중치 비율조정, 통상 최소제곱(OLS), 릿지회귀(Ridge regression)에서 가중치를 추정하여 결합예측오차를 비교 하였다. 본 연구의 실증분석은 전통적 통계방법론과 최근 예측 방법론의 융합적 시스템이 해결해야 하는 많은 문제들에 앞에 있어서 좋은 모델로 승화되어 향후 빅데이터 관련한 도움이 될 것이다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.