$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 유전자 알고리즘을 이용한 다분류 SVM의 최적화: 기업신용등급 예측에의 응용
Optimization of Multiclass Support Vector Machine using Genetic Algorithm: Application to the Prediction of Corporate Credit Rating 원문보기

Information Systems Review, v.16 no.3, 2014년, pp.161 - 177  

안현철 (국민대학교 경영대학 경영정보학부)

초록
AI-Helper 아이콘AI-Helper

기업신용등급은 금융시장의 신뢰를 구축하고 거래를 활성화하는데 있어 매우 중요한 요소로서, 오래 전부터 학계에서는 보다 정확한 기업신용등급 예측을 가능케 하는 다양한 모형들을 연구해 왔다. 구체적으로 다중판별분석(Multiple Discriminant Analysis, MDA)이나 다항 로지스틱 회귀분석(multinomial logistic regression analysis, MLOGIT)과 같은 통계기법을 비롯해, 인공신경망(Artificial Neural Networks, ANN), 사례기반추론(Case-based Reasoning, CBR), 그리고 다분류 문제해결을 위해 확장된 다분류 Support Vector Machines(Multiclass SVM)에 이르기까지 다양한 기법들이 학자들에 의해 적용되었는데, 최근의 연구결과들에 따르면 이 중에서도 다분류 SVM이 가장 우수한 예측성과를 보이고 있는 것으로 보고되고 있다. 본 연구에서는 이러한 다분류 SVM의 성능을 한 단계 더 개선하기 위한 대안으로 유전자 알고리즘(GA, Genetic Algorithm)을 활용한 최적화 모형을 제안한다. 구체적으로 본 연구의 제안모형은 유전자 알고리즘을 활용해 다분류 SVM에 적용되어야 할 최적의 커널 함수 파라미터값들과 최적의 입력변수 집합(feature subset)을 탐색하도록 설계되었다. 실제 데이터셋을 활용해 제안모형을 적용해 본 결과, MDA나 MLOGIT, CBR, ANN과 같은 기존 인공지능/데이터마이닝 기법들은 물론 지금까지 가장 우수한 예측성과를 보이는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안모형이 더 우수한 예측성과를 보임을 확인할 수 있었다.

Abstract AI-Helper 아이콘AI-Helper

Corporate credit rating assessment consists of complicated processes in which various factors describing a company are taken into consideration. Such assessment is known to be very expensive since domain experts should be employed to assess the ratings. As a result, the data-driven corporate credit ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 비교모형으로는 기업신용등급 예측에 전통적으로 많이 적용되어 온 각종 통계 및 인공지능 기법들을 모두 적용하였다. 구체적으로 통계 모형인 (1) 다중판별분석(MDA), (2) 다항 로지스틱 회귀분석(MLOGIT), 인공지능 모형인 (3) 사례기반추론(CBR), (4) 인공신경망(ANN), 그리고 (5) 전통적인 MSVM을 실험하였는데, 전통적인 MSVM의 경우에는 대표적인 5가지 기법-즉 OAO, OAA, DAGSVM, WW, CS를 모두 적용해 보고, 이들과 비교해 제안모형인 GAMSVM이 의미 있는 성과개선을 가져오는지 확인해 보고자 하였다.
  • 본 논문에서는 GA를 활용해 커널함수의 파라미터와 입력변수 선택을 최적화 하는 새로운 MSVM 모형(GAMSVM)을 제안하고, 이를 기업 신용등급 예측 분야에 적용하여 예측성과가 가시적으로 개선됨을 확인하였다. 특히 GAMSVM의 경우, 전통적으로 사용되어 온 MDA, MLOGIT, CBR, ANN은 물론, 많은 기존 문헌에서 예측성과가 가장 우수한 기법으로 소개되어 온 MSVM과 비교해도 월등하게, 그리고 일관성 있게 우수한 성능을 나타내고 있어 향후 기업신용등급을 보다 정확하게 예측하고자 하는 산업계에서 유용하게 응용될 수 있을 것으로 기대된다.
  • 본 연구에서는 GAMSVM을 검증하기 위해, 실제 현장에서 사용되는 국내 기업들의 채권등급 평가 관련 데이터에 해당 모형을 적용해 보았다. 대상이 된 데이터는 제조업으로 분류되는 KOSPI에 상장되어 있거나 KOSDAQ에 등록되어 있는 1,295개의 기업 데이터인데, 여기에는 이들 기업 들의 39개 재무관련 변수들과 당해연도 회사채 신용등급 결과를 포함되어 있다.
  • , 2015)이 최근까지도 계속해서 발표되고 있음을 고려할 때, MSVM에서도 동일하게 예측 정확도가 개선될 수 있을 것으로 기대된다. 본 연구에서는 이러한 제안모형의 성능을 검증하고, 실제 경영 분야 문제해결에 적용될 수 있는 가능성이 얼마나 큰 지 확인해 보기 위해, 실존하는 국내 한 대형 기업신용평가업체로부터 수집된 데이터에 제안모형을 적용해 보고 그 예측력을 다른 비교모형들과 비교해 봄으로서, 그 성능을 살펴보고자 하였다.
  • 앞서 살펴본 기존 문헌들에 대한 분석결과를 토대로 본 연구에서는 기업신용등급 예측 개선을 위해 MSVM의 커널 파라미터와 입력변수 집합을 동시에 최적화하는 모형을 새롭게 제안한다. 특히 본 연구에서는 Chatterjee(2013)에서 그 효과가 입증된 GA를 활용해 최적화가 수행되는 모형을 제안한다.
  • 본 연구에서 제안하는 GAMSVM 모형은 대용량 데이터를 이용하면서도 정확한 의사결정을 지원할 수 있도록 설계되어야 한다. 이러한 목표는 분석에 사용되는 데이터마이닝 기법의 목적함수와 GA의 적합도함수를 일치시키고 GA가 적합도함수를 최적화하기 위해 탐색할 공간을 전체 원 데이터로 설정함으로써 구현할 수 있다. 이러한 배경에서, 유전자 알고리즘의 적합도 함수는 학습용 데이터 셋에 대한 분류 정확도(classification accuracy)로 설정하였으며, 학습용 데이터 셋을 대상으로 GA가 최적의 커널 파라미터와 입력변수 선택을 탐색할 수 있도록 하였다.
  • 이러한 배경에서 본 연구는 기업신용등급평가 모형의 예측 정확도 제고를 목표로 하여, 최근 활발하게 연구되고 있는 MSVM 기법을 보다 개선시킬 수 있는 ‘유전자 알고리즘(genetic algorithms, GA) 기반의 최적화 모형’을 제안한다.
  • 본 연구에서 제안하는 모형은 기본적으로 OAO기반의 MSVM과 GA가 결합된 형태로 구성되어 있다. 이에 기존 문헌을 검토하게 될 본 절에서는 우선 MSVM의 기본적인 개념과 원리에 대해 먼저 살펴보고, 이어 GA에 대한 기본적인 소개와 함께, MSVM과 GA를 결합하고자 시도했던 기존 연구들을 살펴본다.
  • 본 연구가 갖는 의의를 살펴보면, 크게 3가지 정도를 들 수 있다. 첫째, 본 연구는 기업신용평가 분야에 MSVM 최적화 모형을 처음으로 적용해 보려고 시도하였다는 점에서 학술적인 의의를 갖는다. 앞서 문헌 고찰을 통해 살펴보았듯이, 이분류 SVM과 달리 MSVM의 경우에는 최적화에 관한 연구가 아직 걸음마 단계에 있는 실정이다.
  • 앞서 살펴본 기존 문헌들에 대한 분석결과를 토대로 본 연구에서는 기업신용등급 예측 개선을 위해 MSVM의 커널 파라미터와 입력변수 집합을 동시에 최적화하는 모형을 새롭게 제안한다. 특히 본 연구에서는 Chatterjee(2013)에서 그 효과가 입증된 GA를 활용해 최적화가 수행되는 모형을 제안한다. 편의상 본 연구에서는 제안모형을 GAMSVM(Genetic Algorithm-based Multiclass Support Vector Machine)으로 칭하기로 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
SVM기반 모형은 어떤 장점을 가지고 있는가? 이러한 인공신경망의 문제를 해결할 수 있는 대안으로 최근 SVM(support vector machine)이 부상하고 있다. 기존 인공신경망 모형은 경험적 위험 최소화(empirical risk minimization) 원칙에 기반하고 있어 지역 최적화된 해로 수렴할 위험이 높지만, SVM은 구조적 위험 최소화(structural risk minimization) 원칙에 의해 학습을 수행하므로 이론적으로 전역 최적해를 얻을 수 있다(김진화 등, 2008; 안현철, 김경재, 2009). 또한 인공신경망과 비교해 최적화가 요구되는 설계 파라미터의 수도 적고, 소위 서포트 벡터(support vector)라는 이름의 경계면 주변의 데이터만 사용해 학습이 이루어지기 때문에, 적은 수의 데이터만으로도 학습이 이루어질 수 있다는 장점이 있다. 다만, 분류를 위한 SVM(support vector classification, SVC)은 본래 이분류(binary classification) 문제를 해결하기 위한 방법으로 설계된 알고리즘이기 때문에, 신용등급 분류와 같은 다분류 문제의 해결에는 직접적으로 적용될 수 없다는 한계가 있다 (Vapnik, 1995).
기업의 신용등급 크게 어떻게 나뉘는가? 일반적으로 기업의 신용등급은 크게 A1, A2, A3, B, C의 5등급으로 나뉘는데, 본 연구에서는 A1을 1로, A2를 2로, A3를 3으로, 그리고 B와 C를 4로 표기하였다. B와 C를 하나의 등급으로 취급한 이유는 C등급에 속하는 사례들의 빈도가 상대적으로 너무 부족하고, 보통 신용평가회사들이 기업 들에 대한 신용등급의 하한을 B등급으로 부여하는 관행을 갖고 있어 B등급 이하는 그 자체로 투자부적격채권(junk bond)의 의미로 해석할 수 있기 때문이다(안현철, 김경재, 2009; 안현철 등, 2006).
기업신용등급평가가 기업의 부도 위험을 제때 반영하지 못하는 문제를 막기 위해 기업들은 어떤 조치를 취하고 있는가? 아울러, 신용평가회사들이 공시하는 신용등급은 일정 주기를 갖고 갱신되는데, 간혹 평가대상 회사가 갖고 있는 부도위험을 제 때 반영하지 못하는 경우도 종종 발생한다. 이러한 이유로 오늘날 금융권 기업들을 필두로 하여, 많은 기업들이 신용평가회사들이 갱신된 신용등급 정보를 공표하기 전에 자체 적으로 투자대상이나 거래처에 대한 신용등급을 예측할 수 있는 독자적인 기업신용등급예측 모형을 개발하여 운용하고 있다(안현철, 김경재, 2009; Cao et al., 2006).
질의응답 정보가 도움이 되었나요?

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로