본 연구에서는 기업의 부도를 사전에 예측하기 위한 모형을 연구하였고 정량 정보인 재무 데이터와 비정형 정보인 뉴스 콘텐츠의 감성분석 정보를 변수로 선정하였다. 재무 정보는 회계와 재무분야의 문헌에서 잘 알려지고 오랜 기간을 통하여 검증된 3개의 재무모델 변수(Altman, 1968; Beaver, 1968; Horrigan, 1966)와 기업의 경영상태를 종합적으로 분석하는 방법인 기업경영분석 지표(한국은행)를 결합하여 총 3개년치의 재무변수를 선정하였다.
기업의 부도 징후를 나타내는 유의미한 재무적 요인을 도출하기 위해 t-test와 logistic regression방법으로 통계적 검증 작업을 진행하였고, 연구 결과 총자산 이익잉여금률, 총자산 이익률, 매출액 운전자본 비율, 자본 매출액 비율, 차입금 의존도가 유의미한 재무 변수로 확인되었다.
비정형 정보인 뉴스 콘텐츠가 기업 부도를 예측하는데 얼마나 효과적인지 검증하기 위해 재무 변수에 뉴스 감성 분석 점수를 추가하여 ...
본 연구에서는 기업의 부도를 사전에 예측하기 위한 모형을 연구하였고 정량 정보인 재무 데이터와 비정형 정보인 뉴스 콘텐츠의 감성분석 정보를 변수로 선정하였다. 재무 정보는 회계와 재무분야의 문헌에서 잘 알려지고 오랜 기간을 통하여 검증된 3개의 재무모델 변수(Altman, 1968; Beaver, 1968; Horrigan, 1966)와 기업의 경영상태를 종합적으로 분석하는 방법인 기업경영분석 지표(한국은행)를 결합하여 총 3개년치의 재무변수를 선정하였다.
기업의 부도 징후를 나타내는 유의미한 재무적 요인을 도출하기 위해 t-test와 logistic regression방법으로 통계적 검증 작업을 진행하였고, 연구 결과 총자산 이익잉여금률, 총자산 이익률, 매출액 운전자본 비율, 자본 매출액 비율, 차입금 의존도가 유의미한 재무 변수로 확인되었다.
비정형 정보인 뉴스 콘텐츠가 기업 부도를 예측하는데 얼마나 효과적인지 검증하기 위해 재무 변수에 뉴스 감성 분석 점수를 추가하여 모델링을 적용하였다. 부도 기업인 경우 부도 직전 6개월치 뉴스를, 정상 기업인 경우 2019. 7 ~ 12월까지의 6개월치 뉴스 기사를 크롤링 하였고 실제 기업 뉴스와 상관없는 기사들은 정제 작업 등의 전처리를 진행하였다. 정제가 완료된 텍스트에서 명사를 추출하여 말뭉치 기반의 감성사전을 구축하고 뉴스의 수집 기간별 감성점수를 변수로 추가하였다.
기업 뉴스의 감성점수를 추가한 결과 재무 데이터만을 사용했을 때보다 훨씬 더 좋은 성능이 나타남을 알 수 있었다. 민감도 기준(실제 부도기업을 부도기업으로 예측)으로 가장 성능이 우수한 SVM(Support Vector Machine)의 경우 재무 변수만 사용했을 때 87.50%였는데 뉴스 감성점수를 추가했을 때 93.75%로 약 6% 정도의 성능 향상이 있었다. 그리고 뉴스 수집기간은 3,4개월치를 적용 했을 때 민감도의 성능이 가장 좋은 것으로 확인되었다.
금융기관에서는 전통적으로 부도 예측을 위해 재무 데이터를 주로 사용하고 있는데 해당 정보는 분기별로 업데이트가 되는 정보의 적시성에 문제가 있을 수 있다. 따라서 부도 예측시 본 연구에서 실증한 온라인 뉴스의 감성분석 정보인 비정형 데이터를 함께 사용한다면 효과적인 여신 의사결정 지원 체계를 수립하는데 많은 도움이 될 것으로 판단된다.
본 연구에서는 기업의 부도를 사전에 예측하기 위한 모형을 연구하였고 정량 정보인 재무 데이터와 비정형 정보인 뉴스 콘텐츠의 감성분석 정보를 변수로 선정하였다. 재무 정보는 회계와 재무분야의 문헌에서 잘 알려지고 오랜 기간을 통하여 검증된 3개의 재무모델 변수(Altman, 1968; Beaver, 1968; Horrigan, 1966)와 기업의 경영상태를 종합적으로 분석하는 방법인 기업경영분석 지표(한국은행)를 결합하여 총 3개년치의 재무변수를 선정하였다.
기업의 부도 징후를 나타내는 유의미한 재무적 요인을 도출하기 위해 t-test와 logistic regression방법으로 통계적 검증 작업을 진행하였고, 연구 결과 총자산 이익잉여금률, 총자산 이익률, 매출액 운전자본 비율, 자본 매출액 비율, 차입금 의존도가 유의미한 재무 변수로 확인되었다.
비정형 정보인 뉴스 콘텐츠가 기업 부도를 예측하는데 얼마나 효과적인지 검증하기 위해 재무 변수에 뉴스 감성 분석 점수를 추가하여 모델링을 적용하였다. 부도 기업인 경우 부도 직전 6개월치 뉴스를, 정상 기업인 경우 2019. 7 ~ 12월까지의 6개월치 뉴스 기사를 크롤링 하였고 실제 기업 뉴스와 상관없는 기사들은 정제 작업 등의 전처리를 진행하였다. 정제가 완료된 텍스트에서 명사를 추출하여 말뭉치 기반의 감성사전을 구축하고 뉴스의 수집 기간별 감성점수를 변수로 추가하였다.
기업 뉴스의 감성점수를 추가한 결과 재무 데이터만을 사용했을 때보다 훨씬 더 좋은 성능이 나타남을 알 수 있었다. 민감도 기준(실제 부도기업을 부도기업으로 예측)으로 가장 성능이 우수한 SVM(Support Vector Machine)의 경우 재무 변수만 사용했을 때 87.50%였는데 뉴스 감성점수를 추가했을 때 93.75%로 약 6% 정도의 성능 향상이 있었다. 그리고 뉴스 수집기간은 3,4개월치를 적용 했을 때 민감도의 성능이 가장 좋은 것으로 확인되었다.
금융기관에서는 전통적으로 부도 예측을 위해 재무 데이터를 주로 사용하고 있는데 해당 정보는 분기별로 업데이트가 되는 정보의 적시성에 문제가 있을 수 있다. 따라서 부도 예측시 본 연구에서 실증한 온라인 뉴스의 감성분석 정보인 비정형 데이터를 함께 사용한다면 효과적인 여신 의사결정 지원 체계를 수립하는데 많은 도움이 될 것으로 판단된다.
The purpose of this study is to predict corporate bankruptcies in advance and selected quantitatitive information which is financial information and selected sentiment analysis information of online news data which is unsctructured information, as vaiables. Financial information is a...
The purpose of this study is to predict corporate bankruptcies in advance and selected quantitatitive information which is financial information and selected sentiment analysis information of online news data which is unsctructured information, as vaiables. Financial information is a method that comprehensively analyzes the business status of a company and three financial model variables (Altman, 1968; Beaver, 1968; Horrigan, 1966), which are well known in accounting and finance literature and verified over a long period of time. A total of three-year financial variables were selected by combining the management analysis index (Bank of Korea). To derive meaningful financial factors that indicate signs of corporate default, Statistical verification was performed using t-test and logistic regression methods, and as a result of the study, total asset retained earnings rate, total asset margin, sales working capital ratio, capital sales ratio, and dependence on borrowings were found to be significant financial variables. In order to verify how effective news content, modeling was applied by adding news sentiment analysis scores to financial variables. A corpus-based sentiment dictionary was constructed by extracting nouns from the refined text, and sentiment scores for each news collection period were added as a variable. As a result of adding the sentiment score of corporate news, it was found that the performance was much better than when using only financial data. In the case of the SVM, which has the best performance in terms of sensitivity (predicting an actual bankrupt company as a bankrupt company), And it was confirmed that the sensitivity performance was the best when the news collection period was applied for 3 to 4 months. Therefore, if unstructured data, which is the sentiment analysis information of online news verified in this study, is used together in predicting bankruptcy, it will be very helpful to establish an effective loan decision support system.
The purpose of this study is to predict corporate bankruptcies in advance and selected quantitatitive information which is financial information and selected sentiment analysis information of online news data which is unsctructured information, as vaiables. Financial information is a method that comprehensively analyzes the business status of a company and three financial model variables (Altman, 1968; Beaver, 1968; Horrigan, 1966), which are well known in accounting and finance literature and verified over a long period of time. A total of three-year financial variables were selected by combining the management analysis index (Bank of Korea). To derive meaningful financial factors that indicate signs of corporate default, Statistical verification was performed using t-test and logistic regression methods, and as a result of the study, total asset retained earnings rate, total asset margin, sales working capital ratio, capital sales ratio, and dependence on borrowings were found to be significant financial variables. In order to verify how effective news content, modeling was applied by adding news sentiment analysis scores to financial variables. A corpus-based sentiment dictionary was constructed by extracting nouns from the refined text, and sentiment scores for each news collection period were added as a variable. As a result of adding the sentiment score of corporate news, it was found that the performance was much better than when using only financial data. In the case of the SVM, which has the best performance in terms of sensitivity (predicting an actual bankrupt company as a bankrupt company), And it was confirmed that the sensitivity performance was the best when the news collection period was applied for 3 to 4 months. Therefore, if unstructured data, which is the sentiment analysis information of online news verified in this study, is used together in predicting bankruptcy, it will be very helpful to establish an effective loan decision support system.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.