$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

의사결정나무 분석에서 불균형 자료의 분석 연구 : 종합병원의 건강보험료 청구 심사 사례
An Study on Decision Tree Analysis with Imbalanced Data Set : A Case of Health Insurance Bill Audit in General Hospital 원문보기

대한산업공학회/한국경영과학회 2006년도 춘계공동학술대회 논문집, 2006 May 01, 2006년, pp.1667 - 1676  

허준 (SPSS Korea (주)데이터솔루션) ,  김종우 (한양대학교 경영대학 경영학부)

초록
AI-Helper 아이콘AI-Helper

다른 산업과 달리 병원/의료 산업에서는 건강 보험료 심사 평가라는 독특한 검증 과정이 필수적으로 있게 된다. 건강 보험료 심사 평가는 병원의 수익 문제 뿐 아니라 적정한 진료행위를 하는 병원이라는 이미지와도 맞물려 매우 중요한 분야이며, 특히 대형 종합병원일수록 이 부분에 많은 심사관련 인력들을 투입하여, 병원의 수익과 명예를 위해서 업무를 수행하고 있다. 본 논문은 이러한 건강보험료 청구 심사 과정에서, 사전에 수많은 진료 청구 건 중 심사 평가에서 삭감이 될 수 있는 진료 청구 건을 데이터 마이닝을 통해서 발견하여, 사전의 대비를 철저히 하고자 하는 한 국내의 대형 종합병원의 사례를 소개하고자 한다. 데이터 마이닝을 적용함에 있어, 주요한 문제점 중의 하나는 바로 지도학습 기법을 적용하기에 곤란한 데이터 불균형 문제가 발생하는 것이다. 이런 불균형 문제를 해소하고, 비교 조건 중에 가장 효율적인 삭감 예상 진료 건 탐지 모형을 만들어 내기 위하여 데이터 불균형 문제의 기본 해법인 과, Sampling 오분류 비용의 다양하고 혼합적인 적용을 통하여, 적합한 조건을 가지는 의사결정 나무 모형을 도출하였다.

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • [그림 1]의 첫 단계에서 4가지 방법(Under Sampling, Over Sampling, SMOTE를 이용한 Over Sampl ing, 이상치를 이용한 Under Sampling)을 통한 범주 균형 조건이란 것 은, 다수 범주와 소수 범주의 수를 50:50의 균형을 맞추 는 조건뿐만 아니라, 66:34, 75:25, 80:20, 90:10 등 변화를 다양하게 하여 각각 5가지 경우를 고려하였다. 두 번째 단계인 오분류 비용의 변화 조건은 바로 의사결정 나무 분석의 장점 중 하나인 오분류 비용을 조정하여, 오 분류가 된 진료 건에 가중치를 주어서, 데이터 불균형 문제를 해결하고자 하는 것이다.[표 2]의 FN:FP 비가 1:1 이 아니고 다른 경우가 바로 오분류 비용의 가중을 주는 것을 의미한다.
  • , 1998)나 부정한 사기 전화 통화 문제 에 관한 사례 (Fawcett and Provost, 1996), Text(문자)를 해당 문자 그룹 범주에 정확하게 분 류하는 사례(Lewis and Ringuette, 1994) 등 다양한 상황 에서 불균형 데이터 문제는 발생하게 된다. 본 논문에서는 국내의한 종합 병원의 건강보험 심사청구 사례에서 나타난 불균형 데이터 문제 해결 과정을 살펴보기로 한다.
  • 본 논문에서는 사례가 되는 국내의한 대형 종합병원 신경외과 CT(Computerized Tomography: 전산화 단중촬영 , 이하 CT) 건 중에서 건강보험심사평가원에서 삭감이 될 수 있는 의료 행위 건을 사전 탐지하는 의사결정나무 모 형을 개발함에 있어, 데이터 불균형의 문제를 해결한 방법을 사례를 소개하고자 하고, 이를 통해서 다른 유사한 사례에서도 적용할 수 있도록 하고자 한다.
  • [표 2]의 FN:FP 비가 1:1 이 아니고 다른 경우가 바로 오분류 비용의 가중을 주는 것을 의미한다. 본 논문에서의 관심은 FP 즉, 삭감을 비 삭감으로 예측하는 것을 최대한 줄이려는 것이므로 FP의 오분류 비용을 변화시켜서 최적의 조건을 찾고자 하였다. Under Sampling의 경우에는 아무런 가중을 주지 않는 1:1, 1:3 그리고 1:5 3개의 오분류 비용 조건을 정의하였 고, Over Sampling의 경우에는 1:1, 1:5, 1:10, 1:20 등의 오분류 비용을 주었다.
  • 대표적인 2가지 방법 이외에도 2장에서 제시된 것과 같이 다양한 종류의 Sampling 방법들이 제시되었다. 본 사례에서는 현재 소개되어져 있는 주요한 불균형 해소 방 법들을 조합하여 사용하고자 하였다. 즉, 주요한 방법들 을 조합하기 위한 다양한 경우의 수를 생성하고, 이들을 동일한 테스트 데이터를 이용하여, 실험한 다음 가장 효율적인 방법을 선택하고자 하였다.
  • 또한 의료 분야 이외에도 불법 카드 사기 및 보험 사기의 경우에도 본 방법을 적용하여, 보다 나은 모형을 생성할 수도 있을 것이다. 본 사례의 병원에서는 데이터 마이닝을 이용한 보험료 청구삭감 판정 시스템을 본 프로젝트로 이행하기 전 효과성 측정을 하기 위하여, 신경외과 CT건에 한하여 Pilot 프로젝트로 수행하였고, 본 논문에서 제시한 것과 같은 성과를 얻었다. 이를 전체 적으로 적용하기 위해서는 시스템화 시키는 것이 필요하 고, 현재 이를 추진하고 있다.
  • 본 연구에서는 데이터 마이닝의 지도 학습 기법인 의사 결정나무 분석을 이용하여, 병원의 상시 업무인 보험료 심사 업무를 줄이고, 효율을 높일 수 있는 방법을 제시하고 있다. 특히 그 중에서도, 데이터의 불균형으로 의사결 정나무 분석을 제대로 활용 못하는 부득이한 상황에서, Sampling과 오분류 비용 등의 다양한 불균형 해소 기법의 조합을 통하여, 가장 효율적이고, 안정성 있는 모형을 찾 아내는 방법을 제시하고자 하였다.
  • 이는 원 데이터 구조를 그대로 유지하면서, 오 분류에 가중치를 두어, 데이터의 불균형을 해소하고자 하는 방법이다. 오분류 비용의 조정은 의사결정나무 분석 기법에서만 사용이 가능한 것이라고 할 수 있고, 그 외 로지스틱 회귀분석 등의 기법에서는 목적변수에 가중치를 달리 주어 분류가 되는 기준을 변화시켜 불균형한 데이터의 문제를 해소하고자 하였다. 또한 Christianini and Shawe-Taylor (Christianini and Shawe-Taylor, 2000)도 오분류 비용의 조정에 따른 불균형 데이터의 성능 향상을 언급하였、다.
  • 병원은 전체 의료비 중 보험료 해당 금액을 건강보험 관리공단에 청구를 하여 , 그 금액을 받게 되는데, 금액을 받기 전 의료기관(병 원)은 의료행위에 대한 내역을 일정 양식 및 자료 파일화 하여, 건강보험심사평가원에서 과다 진료 및 부당 청구 심사를 받은 후 심사가 완료된 의료/투약 행위 건에 대하 여, 최종적으로 보험금을 받게 된다. 이런 심사 청구 과 정은 불필요한 검사나 진료, 투약 행위 등 부당 의료행위 로 인한 환자의 부담을 가중시키는 것을 사전 차단하여, 올바른 의료 서비스가 정착하는데 목적이 있다.(건강보험 심사평가원, 2006) 이 과정에서 특히 대형 종합병원은 건 강보험심사 평가원에 월 1회 청구를 하기 전 자체적으로 보험료 청구 대상인 의료행위 전부에 대하여 사전 심의 및 정리를 하는 팀 또는 부서를 운영하여, 사전에 과잉/ 부당 의료행위를 방지하고, 또한 환자 및 질병의 특성에 따라 건강심사평가원의 기준에 적발될 수 있는 의료행위에 설명 및 특별 자료를 첨부하여, 합법적인 진료비의 청 구를 진행하고, 가급적 청구된 보험료가 삭감되지 않도록 하고 있다.
  • 제외의 방법으로는 K-평균 군집거리를 이용하여, 다 수 범주의 군집 중심보다는 소수 범주의 군집 중심에 가 까운 다수 범주 건들을 제외하는 방법을 이용하였다. 이렇게 다양한 방법의 조합을 이용하여, 가장 본 사례에 적합한 모델링 방법을 찾는 것이 본 논문의 목적이라고 할 수 있다. 본 사례에서 사용한 분석 프로세스는[그림 1] 과 같다.
  • 본 사례에서는 현재 소개되어져 있는 주요한 불균형 해소 방 법들을 조합하여 사용하고자 하였다. 즉, 주요한 방법들 을 조합하기 위한 다양한 경우의 수를 생성하고, 이들을 동일한 테스트 데이터를 이용하여, 실험한 다음 가장 효율적인 방법을 선택하고자 하였다. 본 사례에서 사용한 방법의 종류는 다음과 같다.
  • 본 연구에서는 데이터 마이닝의 지도 학습 기법인 의사 결정나무 분석을 이용하여, 병원의 상시 업무인 보험료 심사 업무를 줄이고, 효율을 높일 수 있는 방법을 제시하고 있다. 특히 그 중에서도, 데이터의 불균형으로 의사결 정나무 분석을 제대로 활용 못하는 부득이한 상황에서, Sampling과 오분류 비용 등의 다양한 불균형 해소 기법의 조합을 통하여, 가장 효율적이고, 안정성 있는 모형을 찾 아내는 방법을 제시하고자 하였다. 본 논문에서 제시한 불균형 해소 방법을 다른 종합/개인 병원이나, 신경외과 의 CT 이외에 다른 진료과 분야에도 활용할 수 있을 것으로 판단된다.

가설 설정

  • 기본적으로 심사 업무량을 30% 이하로 줄일 것. (제 1종 오류의고정)
  • 기본 심사 업무량이 30% 이상 줄어 있는 경우에서 최고의 정확도를 가질 것
본문요약 정보가 도움이 되었나요?
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로