기업의 부도를 예측하는 것은 회계, 재무, 경영 분야에서 항상 중요하고 또한 중요한 의미를 갖는 연구주제이다. 1960년 이후부터 꾸준히 연구되고 있으며 국내의 경우 IMF 사태 이후 특히, 기업부도 예측에 관한 중요성이 꾸준히 대두되어 지고 있다. 지금까지 기업 부도 예측을 위해 여러 기계학습 알고리즘 기법들이 적용되어 결과를 증명되었다. 기업의 부도 예측 관련 연구로 기존에는 전통적인 통계적 기법과 ...
기업의 부도를 예측하는 것은 회계, 재무, 경영 분야에서 항상 중요하고 또한 중요한 의미를 갖는 연구주제이다. 1960년 이후부터 꾸준히 연구되고 있으며 국내의 경우 IMF 사태 이후 특히, 기업부도 예측에 관한 중요성이 꾸준히 대두되어 지고 있다. 지금까지 기업 부도 예측을 위해 여러 기계학습 알고리즘 기법들이 적용되어 결과를 증명되었다. 기업의 부도 예측 관련 연구로 기존에는 전통적인 통계적 기법과 머신러닝분석 기법이 활용되어 진행되어왔다. 전통적 통계분석 방법 중 판별분석의 경우 변수 간 분산-공분산 행렬이 동일하며 가정으로서, 정규분포를 가져야 하는 단점이 존재한다. 이에 따라 1990년 이후부터 다양한 머신러닝을 활용한 연구가 수행되고 있다. 특히나 인공신경망(Artificial Neural Network, ANN)의 경우 전통적인 통계분석보다 정확도가 높아 많이 활용된 방법론 중 하나이다. 비선형 자료나 복잡한 자료에서 지식이나 패턴 등을 예측할 수 있으며, 상대적으로 비교하였을 때 적응력(adaptability)이 뛰어나며 견고(robust)한 장점이 있다. 하지만, 인공신경망은 과도한 학습으로 인한 과대 적합(Overfitting)이라는 문제가 발생한다는 단점이 존재하여 이를 극복한 분석 방법으로 서포트 벡터 머신(Support Vector Machine, SVM)이 등장하였다. SVM은 ANN과 비교하였을 때, 결과 해석이 용이하고, 적은 양의 학습자료를 가지고도 신속하게 분리 학습을 수행할 수 있으며, 높은 정확도를 자랑한다. 따라서 ANN이나 SVM을 활용하여 많은 부도 예측 관련 선행 연구들이 수행되었었다. 이렇게 여러 기법들이 존재하며, 비외감 중공업 분야의 부도 예측 또한 활발히 수행 중인 것으로 확인되지만, 이에 대한 정확한 예측정확도의 비교 및 성능 비교 등의 수치화로 된 자료로 제시되는 연구는 없는 것으로 나타났다. 따라서 본 연구에서는 현존하는 기계학습 알고리즘 기법(선형판별분석, 로지스틱 회귀, 인공신경망, SVM(RBF, 선형, 다항식), Bagging, Random Forest, Bayesianism)들을 국내 비외감 중공업 데이터를 분석한 결과를 토대로 어느 기법이 기업부도 예측에 우수한 예측력을 제시하는지 결과를 도출하는 것이 본 연구의 목적이다. 선행논문(Flavio Barboza 외, 2017 Machine learning models and bankruptcy prediction)은 1985년~2013년 기간의 북미 기업에 대한 데이터를 사용하여 선형판별분석, 로지스틱 회귀분석, 인공신경망, SVM, 부스팅, 배깅, 랜덤포레스트의 예측도를 비교한 연구가 있다. 해당 연구에서는 랜덤포레스트, 인공신경망 등이 로지스틱 회귀분석, 선형 판별분석 등 보다 최대 20%까지 예측정확도가 더 높은 것을 확인할 수 있었다. 김민규(2019) 또한 기존 인공신경망 기반(ANN, SVM)과 확률론적 방법론(나이브베이지안, 확률신경망)을 비교하여 인공신경망의 예측정확도의 우수성을 제시하였다. 현 연구 결과 또한 이런 선행연구와 방향성이 일치하여 랜덤 포레스트, 인공신경망이 타 기법들보다 우위에서 예측정확도를 보이는 것을 연구 결과로 도출하였다.
기업의 부도를 예측하는 것은 회계, 재무, 경영 분야에서 항상 중요하고 또한 중요한 의미를 갖는 연구주제이다. 1960년 이후부터 꾸준히 연구되고 있으며 국내의 경우 IMF 사태 이후 특히, 기업부도 예측에 관한 중요성이 꾸준히 대두되어 지고 있다. 지금까지 기업 부도 예측을 위해 여러 기계학습 알고리즘 기법들이 적용되어 결과를 증명되었다. 기업의 부도 예측 관련 연구로 기존에는 전통적인 통계적 기법과 머신러닝 분석 기법이 활용되어 진행되어왔다. 전통적 통계분석 방법 중 판별분석의 경우 변수 간 분산-공분산 행렬이 동일하며 가정으로서, 정규분포를 가져야 하는 단점이 존재한다. 이에 따라 1990년 이후부터 다양한 머신러닝을 활용한 연구가 수행되고 있다. 특히나 인공신경망(Artificial Neural Network, ANN)의 경우 전통적인 통계분석보다 정확도가 높아 많이 활용된 방법론 중 하나이다. 비선형 자료나 복잡한 자료에서 지식이나 패턴 등을 예측할 수 있으며, 상대적으로 비교하였을 때 적응력(adaptability)이 뛰어나며 견고(robust)한 장점이 있다. 하지만, 인공신경망은 과도한 학습으로 인한 과대 적합(Overfitting)이라는 문제가 발생한다는 단점이 존재하여 이를 극복한 분석 방법으로 서포트 벡터 머신(Support Vector Machine, SVM)이 등장하였다. SVM은 ANN과 비교하였을 때, 결과 해석이 용이하고, 적은 양의 학습자료를 가지고도 신속하게 분리 학습을 수행할 수 있으며, 높은 정확도를 자랑한다. 따라서 ANN이나 SVM을 활용하여 많은 부도 예측 관련 선행 연구들이 수행되었었다. 이렇게 여러 기법들이 존재하며, 비외감 중공업 분야의 부도 예측 또한 활발히 수행 중인 것으로 확인되지만, 이에 대한 정확한 예측정확도의 비교 및 성능 비교 등의 수치화로 된 자료로 제시되는 연구는 없는 것으로 나타났다. 따라서 본 연구에서는 현존하는 기계학습 알고리즘 기법(선형판별분석, 로지스틱 회귀, 인공신경망, SVM(RBF, 선형, 다항식), Bagging, Random Forest, Bayesianism)들을 국내 비외감 중공업 데이터를 분석한 결과를 토대로 어느 기법이 기업부도 예측에 우수한 예측력을 제시하는지 결과를 도출하는 것이 본 연구의 목적이다. 선행논문(Flavio Barboza 외, 2017 Machine learning models and bankruptcy prediction)은 1985년~2013년 기간의 북미 기업에 대한 데이터를 사용하여 선형판별분석, 로지스틱 회귀분석, 인공신경망, SVM, 부스팅, 배깅, 랜덤포레스트의 예측도를 비교한 연구가 있다. 해당 연구에서는 랜덤포레스트, 인공신경망 등이 로지스틱 회귀분석, 선형 판별분석 등 보다 최대 20%까지 예측정확도가 더 높은 것을 확인할 수 있었다. 김민규(2019) 또한 기존 인공신경망 기반(ANN, SVM)과 확률론적 방법론(나이브베이지안, 확률신경망)을 비교하여 인공신경망의 예측정확도의 우수성을 제시하였다. 현 연구 결과 또한 이런 선행연구와 방향성이 일치하여 랜덤 포레스트, 인공신경망이 타 기법들보다 우위에서 예측정확도를 보이는 것을 연구 결과로 도출하였다.
Corporate bankruptcy prediction is always an important in the fields of accounting, finance and management, and also it is a subject of studies carrying an important meaning. It has been under constant studies since 1960, and the importance of corporate bankruptcy prediction has steadily emerged, in...
Corporate bankruptcy prediction is always an important in the fields of accounting, finance and management, and also it is a subject of studies carrying an important meaning. It has been under constant studies since 1960, and the importance of corporate bankruptcy prediction has steadily emerged, in particular, since the IMF crisis in the case of our country. So far, various machine learning algorithm techniques have been applied to corporate bankruptcy prediction, while proving the results. In the past, traditional statistical techniques and machine learning analysis techniques have been utilized to conduct the studies related to the corporate bankruptcy prediction. Among the traditional methods of statistical analysis, there exist disadvantages in the case of discriminant analysis such as the variance-covariance matrix between variables should be same, and the assumption should have a normal distribution. Accordingly, there have been studies being conducted in use of various machine learning since 1990. In particular, the Artificial Neural Network(ANN) is one of the most utilized methodologies since it has higher accuracy than that of traditional statistical analysis. It has advantages such as knowledge and patterns can be predicted from nonlinear or complex data, and also the adaptability is excellent and robust as the results from relative comparisons. However, there exists a disadvantage of overfitting caused by excessive learning in the ANN, so that the support vector machine (SVM) has emerged as an analysis method to overcome the problem. When compared to the ANN, the SVM boasts of advantages such as easier interpretation of results, the performing availability of quick separation learning even under smaller learning data, as well as higher accuracy. Therefore, a number of precedent studies have conducted to predict bankruptcy making use of the ANN and the SVM. While a number of those techniques exist and bankruptcy predictions are also conducting actively in the field of non-audited heavy industries, it showed that no study has presented the accuracy of prediction and its efficiency with the correct numerical data from comparisons. Therefore, the purpose of this study is to draw the conclusion which techniques present excellent power of prediction in corporate bankruptcy prediction based on the analysis data of domestic non-audited heavy industry making use of the currently existing machine learning algorithm techniques, such as linear discriminant analysis, logistic regression analysis, the ANN, the SVM(RBF, linear, and polynomial), Bagging, Random Forest, and Bayesianism. For precedent studies, there is a study compared the predictability of linear discriminant analysis, logistic regression analysis, the ANN, the SVM, Boosting, Bagging, and Random Forest in use of the data of North American corporates during the period of 1985 to 2013(Flavio Barboza et al, 2017, Machine Learning Models and Bankruptcy Prediction). In the study, they identified that those techniques of Random Forest and the ANN showed higher accuracy of prediction by 20% to the maximum compared to the one of logistic regression analysis and linear discriminant analysis. The study by M.K. Kim(2019) also presented the ANN’s excellency in the accuracy of prediction as the comparison results of the existing ANN-based ones(ANN, SVM) with the probabilistic methodologies(Naïve Bayesiaism, probability nerve network). The result from the present study also comes in line with these precedent studies in the directivity, which deducted the result to show the superior prediction accuracy of Random Forest and the ANN than the one of other techniques.
Corporate bankruptcy prediction is always an important in the fields of accounting, finance and management, and also it is a subject of studies carrying an important meaning. It has been under constant studies since 1960, and the importance of corporate bankruptcy prediction has steadily emerged, in particular, since the IMF crisis in the case of our country. So far, various machine learning algorithm techniques have been applied to corporate bankruptcy prediction, while proving the results. In the past, traditional statistical techniques and machine learning analysis techniques have been utilized to conduct the studies related to the corporate bankruptcy prediction. Among the traditional methods of statistical analysis, there exist disadvantages in the case of discriminant analysis such as the variance-covariance matrix between variables should be same, and the assumption should have a normal distribution. Accordingly, there have been studies being conducted in use of various machine learning since 1990. In particular, the Artificial Neural Network(ANN) is one of the most utilized methodologies since it has higher accuracy than that of traditional statistical analysis. It has advantages such as knowledge and patterns can be predicted from nonlinear or complex data, and also the adaptability is excellent and robust as the results from relative comparisons. However, there exists a disadvantage of overfitting caused by excessive learning in the ANN, so that the support vector machine (SVM) has emerged as an analysis method to overcome the problem. When compared to the ANN, the SVM boasts of advantages such as easier interpretation of results, the performing availability of quick separation learning even under smaller learning data, as well as higher accuracy. Therefore, a number of precedent studies have conducted to predict bankruptcy making use of the ANN and the SVM. While a number of those techniques exist and bankruptcy predictions are also conducting actively in the field of non-audited heavy industries, it showed that no study has presented the accuracy of prediction and its efficiency with the correct numerical data from comparisons. Therefore, the purpose of this study is to draw the conclusion which techniques present excellent power of prediction in corporate bankruptcy prediction based on the analysis data of domestic non-audited heavy industry making use of the currently existing machine learning algorithm techniques, such as linear discriminant analysis, logistic regression analysis, the ANN, the SVM(RBF, linear, and polynomial), Bagging, Random Forest, and Bayesianism. For precedent studies, there is a study compared the predictability of linear discriminant analysis, logistic regression analysis, the ANN, the SVM, Boosting, Bagging, and Random Forest in use of the data of North American corporates during the period of 1985 to 2013(Flavio Barboza et al, 2017, Machine Learning Models and Bankruptcy Prediction). In the study, they identified that those techniques of Random Forest and the ANN showed higher accuracy of prediction by 20% to the maximum compared to the one of logistic regression analysis and linear discriminant analysis. The study by M.K. Kim(2019) also presented the ANN’s excellency in the accuracy of prediction as the comparison results of the existing ANN-based ones(ANN, SVM) with the probabilistic methodologies(Naïve Bayesiaism, probability nerve network). The result from the present study also comes in line with these precedent studies in the directivity, which deducted the result to show the superior prediction accuracy of Random Forest and the ANN than the one of other techniques.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.