지금까지 금융기관의 신용 위험 관리를 효과적이고 효율적으로 수행하기 위한 지능형 기술에 대한 연구가 활발하게 이루어져 왔다. 특히 기업의 부실 예측이나 신용 등급 예측 문제를 해결하는데 있어, 다양한 기계학습 분류 알고리즘들이 제안되고 적용되어 왔는데, 이들은 효과적인 입력변수 선정에 대한 해답을 제공해 주지 못하고, ...
지금까지 금융기관의 신용 위험 관리를 효과적이고 효율적으로 수행하기 위한 지능형 기술에 대한 연구가 활발하게 이루어져 왔다. 특히 기업의 부실 예측이나 신용 등급 예측 문제를 해결하는데 있어, 다양한 기계학습 분류 알고리즘들이 제안되고 적용되어 왔는데, 이들은 효과적인 입력변수 선정에 대한 해답을 제공해 주지 못하고, 과적합 및 잡음/이상치에 취약할 수 있는 위험이 있으며, 각종 모수에 대한 조정 작업이 요구되는 한계점이 있었다. 이러한 기존 기법들의 한계를 극복하기 위한 대안으로 본 연구는 랜덤 포레스트(Random Forests)의 응용을 제안한다.
랜덤 포레스트는 미국의 통계학자 Breiman에 의해 제안된 기계학습 기법이다. 단일 의사결정 나무를 다수의 의사결정 나무로 확장시킨 배깅(bagging)과 무작위 입력 변수 선택(random input selection)기법 모두를 채택하고 있다. 랜덤 포레스트는 알고리즘 특성상 과적합에서 자유로우며, 잡음이나 이상치에 받는 영향이 적으며, 높은 정확도를 얻을 수 있는 특징을 지닌다.
본 연구에서는 기업신용등급 평가에 있어서 랜덤 포레스트 기법을 적용하였다. 연구에서 활용된 데이터는 실제 국내 주식시장에 상장된 기업들 1295개이다. 해당 기업들에 대해 2002년 평가된 신용등급을 목적 변수로 설정하여 실험에 적용하였다. 제안된 기법의 성과를 평가 및 비교하기 위해서 전통적인 기법 다변량판별분석, 인공신경망, MSVM 모형을 사용하였다. 각 모형의 성과는 학습 및 검증을 기준으로 예측 정확도를 산출하여 평가하였다. 실증분석 결과, 제안 기법이 전통적인 기법들과 비교해, 훨씬 빠르고 정확한 예측결과를 산출함을 확인할 수 있었다.
지금까지 금융기관의 신용 위험 관리를 효과적이고 효율적으로 수행하기 위한 지능형 기술에 대한 연구가 활발하게 이루어져 왔다. 특히 기업의 부실 예측이나 신용 등급 예측 문제를 해결하는데 있어, 다양한 기계학습 분류 알고리즘들이 제안되고 적용되어 왔는데, 이들은 효과적인 입력변수 선정에 대한 해답을 제공해 주지 못하고, 과적합 및 잡음/이상치에 취약할 수 있는 위험이 있으며, 각종 모수에 대한 조정 작업이 요구되는 한계점이 있었다. 이러한 기존 기법들의 한계를 극복하기 위한 대안으로 본 연구는 랜덤 포레스트(Random Forests)의 응용을 제안한다.
랜덤 포레스트는 미국의 통계학자 Breiman에 의해 제안된 기계학습 기법이다. 단일 의사결정 나무를 다수의 의사결정 나무로 확장시킨 배깅(bagging)과 무작위 입력 변수 선택(random input selection)기법 모두를 채택하고 있다. 랜덤 포레스트는 알고리즘 특성상 과적합에서 자유로우며, 잡음이나 이상치에 받는 영향이 적으며, 높은 정확도를 얻을 수 있는 특징을 지닌다.
본 연구에서는 기업신용등급 평가에 있어서 랜덤 포레스트 기법을 적용하였다. 연구에서 활용된 데이터는 실제 국내 주식시장에 상장된 기업들 1295개이다. 해당 기업들에 대해 2002년 평가된 신용등급을 목적 변수로 설정하여 실험에 적용하였다. 제안된 기법의 성과를 평가 및 비교하기 위해서 전통적인 기법 다변량판별분석, 인공신경망, MSVM 모형을 사용하였다. 각 모형의 성과는 학습 및 검증을 기준으로 예측 정확도를 산출하여 평가하였다. 실증분석 결과, 제안 기법이 전통적인 기법들과 비교해, 훨씬 빠르고 정확한 예측결과를 산출함을 확인할 수 있었다.
There has been a lot of research on intelligent techniques to effectively and efficiently manage credit risk in the financial industry. To solve special issues on the prediction of credit ratings and bankruptcy, various algorithms of machine learning have been proposed and applied. However, the alg...
There has been a lot of research on intelligent techniques to effectively and efficiently manage credit risk in the financial industry. To solve special issues on the prediction of credit ratings and bankruptcy, various algorithms of machine learning have been proposed and applied. However, the algorithms have some limitations. First of all, they are unable to give a solution for which variables in the dataset should be considered as input variables to effectively predict a dependent variable. Also, they are easily exposed to overfitting and risk being affected by outliers and noise. In addition, they are required to tune their numerous parameters.
Therefore, this study proposes the application of Random Forests to overcome the weakness of the traditional techniques. Random Forests were designed by Leo Breiman, an American statistician and professor, and are an ensemble learning technique. This algorithm has both features originating from bagging algorithm, which is to extend a single decision tree to various decision trees, and from random input selection.
The benefit of our proposed algorithm is free from an overfitting issue, and both noise and outliers in the dataset cannot have an effect on it. Thus, our model can yield high accuracy in forecasting corporate credit ratings. In this experiment, we adapted Random Forests algorithm as our proposed model to measure the accuracy of credit ratings on companies in Korea. The data that we used for this research consists of 1,295 corporations listed in the domestic stock market. This research was conducted with the dataset setting corporate credit ratings measured in 2002 as a dependent variable. To evaluate and compare our model with traditional methods, we used the following methods: MDA(Multivariate Discriminant Analysis), ANN(Artificial Neural Network) and MSVM(Multi-class SVM). Each model’s performance was calculated by predictive accuracy based on training and validation.
As a result, our research model showed a better performance for predicting bond ratings for companies than performances from other traditional methods.
There has been a lot of research on intelligent techniques to effectively and efficiently manage credit risk in the financial industry. To solve special issues on the prediction of credit ratings and bankruptcy, various algorithms of machine learning have been proposed and applied. However, the algorithms have some limitations. First of all, they are unable to give a solution for which variables in the dataset should be considered as input variables to effectively predict a dependent variable. Also, they are easily exposed to overfitting and risk being affected by outliers and noise. In addition, they are required to tune their numerous parameters.
Therefore, this study proposes the application of Random Forests to overcome the weakness of the traditional techniques. Random Forests were designed by Leo Breiman, an American statistician and professor, and are an ensemble learning technique. This algorithm has both features originating from bagging algorithm, which is to extend a single decision tree to various decision trees, and from random input selection.
The benefit of our proposed algorithm is free from an overfitting issue, and both noise and outliers in the dataset cannot have an effect on it. Thus, our model can yield high accuracy in forecasting corporate credit ratings. In this experiment, we adapted Random Forests algorithm as our proposed model to measure the accuracy of credit ratings on companies in Korea. The data that we used for this research consists of 1,295 corporations listed in the domestic stock market. This research was conducted with the dataset setting corporate credit ratings measured in 2002 as a dependent variable. To evaluate and compare our model with traditional methods, we used the following methods: MDA(Multivariate Discriminant Analysis), ANN(Artificial Neural Network) and MSVM(Multi-class SVM). Each model’s performance was calculated by predictive accuracy based on training and validation.
As a result, our research model showed a better performance for predicting bond ratings for companies than performances from other traditional methods.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.