$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

신용평가에서 로지스틱 회귀를 이용한 미결정자 추론
Undecided inference using logistic regression for credit evaluation 원문보기 논문타임라인

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.22 no.2, 2011년, pp.149 - 157  

홍종선 (성균관대학교 통계학과) ,  정민섭 (성균관대학교 응용통계연구소)

초록
AI-Helper 아이콘AI-Helper

본 연구는 신용평가 과정에서 발생하는 미결정자를 결측자료 문제로 간주하여 MAR와 MNAR 가정 하에서 추론한다. MAR 가정에서 미결정자 추론은 결정자들에 대한 로지스틱 회귀모형의 회귀 계수벡터를 이용하여 미결정자의 부도 확률을 구한 후 결정자의 부도확률과 비교하여 미결정자의 미래 상태를 판단한다. 그리고 MNAR 가정에서의 미결정자 추론은 특성변수가 추가한 로지스틱 모형으로부터 미결정자의 부도확률을 구하고 미결정자를 예측하는 방법을 제안하였다. 두 종류의 실제 자료에 대하여 모의실험을 한 결과, MAR 가정에서 미결정자의 비율이 증가하더라도 원자료의 오분류율과 추론한 결과 차이가 없으며, MNAR 가정에서는 추가적인 변수를 고려하여 미결정자를 추정하였기 때문에 미결정자의 오분류율이 MAR 가정에서의 오분류율보다 감소하고 나아가 전체에서 미결정자가 차지하는 비율이 증가함에 따라 전체의 오분류율이 더욱 감소함을 발견하였다.

Abstract AI-Helper 아이콘AI-Helper

Undecided inference could be regarded as a missing data problem such as MARand MNAR. Under the assumption of MAR, undecided inference make use of logistic regression model. The probability of default for the undecided group is obtained with regression coefficient vectors for the decided group and co...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 미결정 차주가 미래에 부도 또는 정상 차주인지를 예측하는 것은 매우 힘들고 어렵기 때문에 결정된 차주만으로 모형을 개발하고, 결정된 차주와 미결정된 차주가 모두 포함되어 있는 차주 집단에 대해 적용한다면 큰 편의 (bias)가 발생한다. 이런 문제점을 해결하기 위하여 본 연구에서는 미결정된 차주를 추론하는 방법을 연구한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
미결정 추론 문제는 어떻게 활용될 수 있는가? 미결정 추론 문제는 신용평가에서 차주의 신용상태를 예측하는 문제 뿐만 아니라, 여러 다른 분야에서 추론문제로 활용할 수 있다. 예를 들어 의학에서 의사가 환자의 질병유무의 판단을 내리기 어려운 경우에는 판단을 보류하여 전문의에게 심사를 의뢰하거나 추가적인 검사로 얻은 결과로 다시 판단한다.
신용평가 또는 신용평점제도는 어떻게 신용의 정도를 평점으로 제시하는가? 신용평가 (credit evaluation) 또는 신용평점 (credit scoring) 제도는 구축된 차주 (borrower)의 자료를 바탕으로 신용심사와 관리업무에 사용한다. 신용의 정도를 평점으로 제시하기 위하여 신용상태의 자료를 분석하여 평가모형을 설정하고 평점을 추정한다. 대출자 (은행)는 차주의 평점에 근거하여 정상 (우량; good, non-default)인 차주에게는 대출해주고 부도 (불량; bad, default)를 예상한 차주에게는 대출을 억제하면서 거래를 차등적으로 적용하여 대출자의 수익을 증대하고 위험을 최소화하는 목적이 있다 (Kim과 Lee, 2003; 홍종선과 김지훈, 2009; 홍종선과 권태완, 2010).
미결정 차주가 발생하는 원인은? 신용평가 과정에서 미결정 (undecided) 차주가 발생하는 문제가 발생하는데 다음과 같이 두 종류의 원인으로 구분될 수 있다. 첫 번째는 여러 가지 이유로 심사가 아직 이루어지지 않고 판단이 보류되어 미결정 차주가 발생하며, 두 번째로는 신용평가를 판단하기 어려운 평점 때문에 평가를 유보하고 특별한 전문가에게 재심사를 의뢰하기 위하여 결정이 보류된 미결정 차주가 발생하는 경우이다. 미결정 차주가 미래에 부도 또는 정상 차주인지를 예측하는 것은 매우 힘들고 어렵기 때문에 결정된 차주만으로 모형을 개발하고, 결정된 차주와 미결정된 차주가 모두 포함되어 있는 차주 집단에 대해 적용한다면 큰 편의 (bias)가 발생한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. 홍종선, 권태완 (2010). 수익률 분포의 적합과 리스크값 추정. , 21, 219-229. 

    원문보기 상세보기 타임라인에서 보기
    인용구절

    인용 구절

    신용의 정도를 평점으로 제시하기 위하여 신용상태의 자료를 분석하여 평가모형을 설정하고 평점을 추정한다. 대출자 (은행)는 차주의 평점에 근거하여 정상 (우량; good, non-default)인 차주에게는 대출해주고 부도 (불량; bad, default)를 예상한 차주에게는 대출을 억제하면서 거래를 차등적으로 적용하여 대출자의 수익을 증대하고 위험을 최소화하는 목적이 있다 (Kim과 Lee, 2003; 홍종선과 김지훈, 2009; 홍종선과 권태완, 2010).

  2. 홍종선, 김지훈 (2009). 신용평가모형에서 두 분포함수의 동일성 검정을 위한 비모수적인 검정방법. , 20, 261-272. 

    원문보기 상세보기 타임라인에서 보기
    인용구절

    인용 구절

    신용의 정도를 평점으로 제시하기 위하여 신용상태의 자료를 분석하여 평가모형을 설정하고 평점을 추정한다. 대출자 (은행)는 차주의 평점에 근거하여 정상 (우량; good, non-default)인 차주에게는 대출해주고 부도 (불량; bad, default)를 예상한 차주에게는 대출을 억제하면서 거래를 차등적으로 적용하여 대출자의 수익을 증대하고 위험을 최소화하는 목적이 있다 (Kim과 Lee, 2003; 홍종선과 김지훈, 2009; 홍종선과 권태완, 2010).

  3. 홍종선, 최진수 (2009). ROC와 CAP 곡선에서의 최적분류점. , 22, 911-921. 

    원문보기 상세보기 타임라인에서 보기
    인용구절

    인용 구절

    1994년부터 2005년까지 외감 기업 중 총 자산규모가 4,500억 이상인 한국 기업에 대한 자료이다 (홍종선과 최진수, 2009).

  4. Ananda, B. W. (2010). Receiver operating characteristic curves for measuring the quality of decisions in cricket. Journal of Quantitative Analysis in Sports, 6, Article 8. 

  5. Feelders, A. J. (2000). Credit scoring and reject inference with mixture models. International Journal of Intelligent System in Accounting, 8, 271-279. 

    인용구절

    인용 구절

    Feelders (2000)와 Hand (2001)는 미결정자 추론을 결측자료 (missing data) 문제로 간주하였는데 Little과 Rubin (1987), Feelders (2000)와 Kim (2002)이 정의한 결측값 유형을 살펴보면서 미결정자의 종류를 2절에서 정의한다.

    미결정자는 결측자료 문제로 간주하는데 결측값의 유형은 MCAR (missing completely at random), MAR (missing at random) 그리고 MNAR (missing not at random)로 구분한다 (Little과 Rubin, 1987; Feelders, 2000).

    심사가 보류되어 발생된 미결정자는 미결정자를 제외한 결정자와 동일한 속성을 갖고 있어서 부도로 판단할 확률이 동일하기 때문에 Feelders (2000)의 거절자 추론문제와 동일하게 간주하여 MAR 방법으로 접근하며, 전문가에게 재심사를 의뢰하기 위하여 결정이 보류된 미결정자 추론 문제는 독립변수의 조건부 미결정자는 신용상태에 의존한다.

    심사가 보류되어 발생된 미결정자 그룹 (A1 = u)은 미결정자를 제외한 결정자그룹 (A1 ≠ u)과 동일한 속성을 갖고 있으며 부도로 판단할 확률이 동일하기 때문에 Feelders (2000)는 거절자 추론 (reject inference) 문제로 간주하여 MAR 방법으로 접근하였다.

  6. Hand, D. J. (2001). Reject inference in credit operations. Handbook of Credit Scoring, 225-240. 

    인용구절

    인용 구절

    Feelders (2000)와 Hand (2001)는 미결정자 추론을 결측자료 (missing data) 문제로 간주하였는데 Little과 Rubin (1987), Feelders (2000)와 Kim (2002)이 정의한 결측값 유형을 살펴보면서 미결정자의 종류를 2절에서 정의한다.

  7. Kim, H. J. (2002). Analysis of incomplete data with nonignorable missing values. Journal of the Korean Data & Information Science Society, 13, 167-174. 

    원문보기 상세보기 타임라인에서 보기
    인용구절

    인용 구절

    Feelders (2000)와 Hand (2001)는 미결정자 추론을 결측자료 (missing data) 문제로 간주하였는데 Little과 Rubin (1987), Feelders (2000)와 Kim (2002)이 정의한 결측값 유형을 살펴보면서 미결정자의 종류를 2절에서 정의한다.

  8. Kim, K. S. and Lee, C. S. (2003). A study of data mining optimization model for the credit evaluation. Journal of the Korean Data & Information Science Society, 14, 825-836. 

    원문보기 상세보기 타임라인에서 보기
    인용구절

    인용 구절

    신용의 정도를 평점으로 제시하기 위하여 신용상태의 자료를 분석하여 평가모형을 설정하고 평점을 추정한다. 대출자 (은행)는 차주의 평점에 근거하여 정상 (우량; good, non-default)인 차주에게는 대출해주고 부도 (불량; bad, default)를 예상한 차주에게는 대출을 억제하면서 거래를 차등적으로 적용하여 대출자의 수익을 증대하고 위험을 최소화하는 목적이 있다 (Kim과 Lee, 2003; 홍종선과 김지훈, 2009; 홍종선과 권태완, 2010).

  9. Little, R. J. A. and Rubin, D. B. (1987). Statistical analysis with missing data, Wiley, New York. 

    인용구절

    인용 구절

    미결정자는 결측자료 문제로 간주하는데 결측값의 유형은 MCAR (missing completely at random), MAR (missing at random) 그리고 MNAR (missing not at random)로 구분한다 (Little과 Rubin, 1987; Feelders, 2000).

  10. Pepe, M. S. (1998). Three approaches to regression analysis of receiver operating characteristic curves for continuous test results. Biometrics, 54, 124-135. 

    상세보기
    인용구절

    인용 구절

    Pepe(1998, 2003)에서 분석한 자료를 실증예제로 채택하고 표 4.1과 같이 청각장애의 유무에 관한 자료로 반응변수로 청각장애(Y) 그리고 특성(독립)변수로 가청범위(Xs), 소리강도(Xl), 소리주파수(Xf), 청력한계(Xamt)를 고려한다.

  11. Pepe, M. S. (2003). The statistical evaluation of medical tests for classification and prediction, University Press, Oxford. 

    인용구절

    인용 구절

    Pepe(1998, 2003)에서 분석한 자료를 실증예제로 채택하고 표 4.1과 같이 청각장애의 유무에 관한 자료로 반응변수로 청각장애(Y) 그리고 특성(독립)변수로 가청범위(Xs), 소리강도(Xl), 소리주파수(Xf), 청력한계(Xamt)를 고려한다.

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로