Objectives : To develop a Diagnosis-Related Group (DRG) fraud candidate detection method, using data mining techniques, and to examine the efficiency of the developed method. Methods ; The Study included 79,790 DRGs and their related claims of 8 disease groups (Lens procedures, with or without, vitr...
Objectives : To develop a Diagnosis-Related Group (DRG) fraud candidate detection method, using data mining techniques, and to examine the efficiency of the developed method. Methods ; The Study included 79,790 DRGs and their related claims of 8 disease groups (Lens procedures, with or without, vitrectomy, tonsillectomy and/or adenoidectomy only, appendectomy, Cesarean section, vaginal delivery, anal and/or perianal procedures, inguinal and/or femoral hernia procedures, uterine and/or adnexa procedures for nonmalignancy), which were examined manually during a 32 months period. To construct an optimal prediction model, 38 variables were applied, and the correction rate and lift value of 3 models (decision tree, logistic regression, neural network) compared. The analyses were peformed separately by disease group. Results : The correction rates of the developed method, using data mining techniques, were 15.4 to 81.9%, according to disease groups, with an overall correction rate of 60.7%. The lift values were 1.9 to 7.3 according to disease groups, with an overall lift value of 4.1. Conclusions : The above findings suggested that the applying of data mining techniques is necessary to improve the efficiency of DRG fraud candidate detection.
Objectives : To develop a Diagnosis-Related Group (DRG) fraud candidate detection method, using data mining techniques, and to examine the efficiency of the developed method. Methods ; The Study included 79,790 DRGs and their related claims of 8 disease groups (Lens procedures, with or without, vitrectomy, tonsillectomy and/or adenoidectomy only, appendectomy, Cesarean section, vaginal delivery, anal and/or perianal procedures, inguinal and/or femoral hernia procedures, uterine and/or adnexa procedures for nonmalignancy), which were examined manually during a 32 months period. To construct an optimal prediction model, 38 variables were applied, and the correction rate and lift value of 3 models (decision tree, logistic regression, neural network) compared. The analyses were peformed separately by disease group. Results : The correction rates of the developed method, using data mining techniques, were 15.4 to 81.9%, according to disease groups, with an overall correction rate of 60.7%. The lift values were 1.9 to 7.3 according to disease groups, with an overall lift value of 4.1. Conclusions : The above findings suggested that the applying of data mining techniques is necessary to improve the efficiency of DRG fraud candidate detection.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
물론 정산심사조정 건이 모두 부당청구건이라고 할 수는 없으나, 확인심사 결과 밝혀진 부당청구건 이 모두 정산심사조정을 받으며, 기타 사유로 인해 정산심사조정 되는 경우가 미미하다고 볼 때, 이는 현재의 자료 여건상 부당청구의 실태를 가장 잘 보여주는 척도라 할 수 있다. 따라서 본 연구에서는 부당청구건을 청구자의 고의성 여부와 무관하게, 확인심사 시 정산심사조정이 될 조건을 갖춘 청구건 으로 정의하였다.
본 연구는 DRG 시범사업기간의 확인심사자료에 데이터마이닝 기법을 적용하여 구축된 예측모형을 이용하여 기존의 방법보다 효율적인 확인심사건을 선정하는 방법의 효율성을 검토하였다. 예측모형으로는 의사결정나무분석, 회귀분석, 신경망 분석 등 3가지 모형을 비교하였고, 질병군별로 최적 모형을 선정하여 기존의 질병군별 확인심사율을 적용하였을 때를 기준으로 모형적중률, 예측 향상도를 평가하였다.
이와 같은 배경 하에 본 연구에서는 데이터마이닝을 이용하여 DRG 확인심사건 선정을 효율화하는 방법의 유용성을 검토하고자 하였다. 구체적으로는 데이터마이닝을 이용하여 질병군별, 청구건별 부당청구확률을 계산하여 상위건들을 확인심사 건으로 선정할 때, 심사조정률, 진료비 열외군 등만을 기준으로 확인심사 건을 선정하고 있는 기존 방식보다 효율적임을 보고자 하였다.
가설 설정
둘째, 정산심사조정확률의 순서에 따라 전체 데이터 세트를 정렬한다. 셋째, 정렬된 전체 데이터 세트를 균일하게 N 등분한다. 넷째, N 등분의 각 등급에서 정산심사조정 건의 빈도를 구한다.
제안 방법
그러나 위 자료들의 경우 최근 상당부분 보완이 되었음에도 불구하고 요양기관의 불성실 신고로 인하여 여전히 자료의 충실성이 의심받고 있는 실정이다. 그러나 본연구에서는 불성실 신고 자체가 요양기관의 특성을 반영한다는 점을 감안하여현재 심사평가원에서 확보하고 있는 자료를 기준으로 분석하였다.
모형은 질병군별로 의사결정나무모형(decision tree), 신경 망모형(neural network), 로지스틱 회 귀모형(logistic regres-sion)의 3개 모형을 구축하였다. 의사결정 나무모형은 이미 CHAID, CART, C4.
본 연구에서는 기존의 확인심사건 선정 방법을 사용했을 때와 비교하여 DRG 질병군별 동일한 양의 확인심사건을 정했을 때를 기준으로 모형을 평가하였다(Table 2).
5등의 알고리즘이 제안되어 있으며, SAS E-miner는 모형구축의 단계에서 분리기준 및 유의수준 등을 조정함으로써 근사적으로 위 3가지 알고리즘을 수행할 수 있다. 본 연구에서는 분리기준(splitting criterion)으로 카이제곱검정의 p-값을 사용함으로써 p-값이 가장 작은 예측변수와 그 때의 최적분리에 의해서 자식 마디를 형성하도록 하였다. 정지기준(stop criterion)으로 끝마디에 포함될 관측 개체의 최 소개 수(minimum number of observations in a leal)는 1, 임의의 분리 기준에 의해 부모마디가 자식마디로 분리되기 위해 요구되는 관측개체의 수(observations required for a split search)는 질병군별 전체관측개체수의 1%, 자식 마디가 형성될 때 고려될 최대의 분리 개수(maximum number of branches from a node)는 2, 뿌리마디로부터 끝마디까지의 깊이 (maximum depth of tree) 는 6 을 적용하였다.
신경망모형은 다층인식자 망구조(multilayer perception network archi-tecture)를 적용하였고, 3회의 사전분석 (preliminary analysis)을 시 행 함으로써 가중치의 적절한 초기값을 탐색해 학습 결과가 편향된 최적화가 되지 .않도록 하였다.
예측모형으로는 의사결정나무분석, 회귀분석, 신경망 분석 등 3가지 모형을 비교하였고, 질병군별로 최적 모형을 선정하여 기존의 질병군별 확인심사율을 적용하였을 때를 기준으로 모형적중률, 예측 향상도를 평가하였다. 질병군별로 그 정도에는 차이가 있으나 평균적으로 약 4배의 예측 향상도를.
최종적으로 환자 특성을 반영한다고 생각되는 행위별 요양 급여 비용총액, 환자연령, 청구보험자부담금, 청 구본인부담금, 청 구 요양 급여 비용총액 심사결정액, 심결DRG번호, 심결보험자부담금, 심결 본인 부담금, 심결 요양 급여 비용총액, 보험자코드, 입원일구분, 주상병, 수술여부, 요양일수, 본인 추가부담금, 환자성, 부상병, 중증도, 내원일수 등 20개 변수와 요양기관 특성을 반영한다고 생각되는 지원코드, 종별코드, 분만 병상 수, 개설일자, 상급병상수, 다액기관 구분, 매체구분, 의사수, 수술병상수, 설립 구분 코드, 대표자구분, 표시과목코드, 중환자 병상 수, 총병상수, 경 향요양구분코드, 전체병상수, 요양기호, 지역코드 18개 변수, 그리고 목표변수인 정산심사조정 여부 등 데이터마이닝을 위한 입력변수로 39 개 변수를 선정하였다. 이 중 환자연령, 환자 성 등은 주민등록번호의 일부에서 추출하였고, 각종 병상수 및 의사수는 연구대상 기간 동안의 평균값으로 변형 및 조정하여 적용하였다.
이후 DRG 환자의 명세서공통자료와 DRG 통계자료는 접수번호, 접수년도, 명일련을 primary key로 사용하여 병합한 후 병합이 되지 않은 경우나 연구대상인 외과계 DRG가 아닌 청구건을 제외한 79, 790건을 분석 대상으로 선정하였고, 다시 요양기 호를 primary key로 사용하여 3종의 요양기관 관련파일을 병합하여 최종 분석파일을 완성하였다.
본 연구에서는 분리기준(splitting criterion)으로 카이제곱검정의 p-값을 사용함으로써 p-값이 가장 작은 예측변수와 그 때의 최적분리에 의해서 자식 마디를 형성하도록 하였다. 정지기준(stop criterion)으로 끝마디에 포함될 관측 개체의 최 소개 수(minimum number of observations in a leal)는 1, 임의의 분리 기준에 의해 부모마디가 자식마디로 분리되기 위해 요구되는 관측개체의 수(observations required for a split search)는 질병군별 전체관측개체수의 1%, 자식 마디가 형성될 때 고려될 최대의 분리 개수(maximum number of branches from a node)는 2, 뿌리마디로부터 끝마디까지의 깊이 (maximum depth of tree) 는 6 을 적용하였다.
확인심사가 이루어지기 전에 입력되는 변수일 것, 연구대상 기간 중에 새롭게 추가된 변수는 제외할 것, 오류값의 참값을 추정할 수 없는 경우는 제외할 것 등이다. 최종적으로 환자 특성을 반영한다고 생각되는 행위별 요양 급여 비용총액, 환자연령, 청구보험자부담금, 청 구본인부담금, 청 구 요양 급여 비용총액 심사결정액, 심결DRG번호, 심결보험자부담금, 심결 본인 부담금, 심결 요양 급여 비용총액, 보험자코드, 입원일구분, 주상병, 수술여부, 요양일수, 본인 추가부담금, 환자성, 부상병, 중증도, 내원일수 등 20개 변수와 요양기관 특성을 반영한다고 생각되는 지원코드, 종별코드, 분만 병상 수, 개설일자, 상급병상수, 다액기관 구분, 매체구분, 의사수, 수술병상수, 설립 구분 코드, 대표자구분, 표시과목코드, 중환자 병상 수, 총병상수, 경 향요양구분코드, 전체병상수, 요양기호, 지역코드 18개 변수, 그리고 목표변수인 정산심사조정 여부 등 데이터마이닝을 위한 입력변수로 39 개 변수를 선정하였다. 이 중 환자연령, 환자 성 등은 주민등록번호의 일부에서 추출하였고, 각종 병상수 및 의사수는 연구대상 기간 동안의 평균값으로 변형 및 조정하여 적용하였다.
대상 데이터
각 청구건의 요양기관별 특성변수를 반영하기 위해서는 요양기관 일반현황자료, 요양기 관일 반인원자료, 요양기관병 실 병상자료를 이용하였다.
결국 연구대상기간에 상기 8개 질병 군중 하나로 청구되었고, 명세서공통자료와 DRG통계자료에서 확인심사여부가 모두 확인된 79, 790건을 대상으로 분석을 실시하였다. 각 청구건의 요양기관별 특성변수를 반영하기 위해서는 요양기관 일반현황자료, 요양기 관일 반인원자료, 요양기관병 실 병상자료를 이용하였다.
연구대상 질병군은 2002년 현재 DRG 본사업이 시행중인 외과계 질병군인 수정체 수술, 편도와(또는) 아데노이드 절제술, 항문과(또는) 항문주위수술, 서혜 및 대퇴부 탈장수술, 충수절제술, 자궁과(또는) 자궁부속기 수술(악성종양제외), 제왕절개 분만, 질식분만 등 8개 질병군으로 한정하였다 [10].
연구대상 질병군은 2002년 현재 본사업이 시행되고 있는 8개 외과계 질병군으로 한정하여 분석단위로 삼았다. 연구대상 기간 동안에는 내과계 질병군에 대한 시범사업이 일부 이루어졌으나 그 청구 건수가 많지 않고 현재 본사업 대상이 아니므로 연구결과의 실제적인 적용이 어렵다는 점에서 연구대상에서 제외하였다.
요양기관의 특성을 반영하는 변수를 입력변수로 사용하기 위하여 요양기관 일반현황자료, 요양기 관일 반인원자료, 요양 기관 병실 병상 자료 등을 사용하였다. 그러나 위 자료들의 경우 최근 상당부분 보완이 되었음에도 불구하고 요양기관의 불성실 신고로 인하여 여전히 자료의 충실성이 의심받고 있는 실정이다.
데이터처리
데이터마이닝 솔루션으로는 SAS사의 Enterprise Miner 4.0을 사용하여 데이터의 분할(data partition), 모형의 구축 (modeling), 모형의 평가(assessment)를 실시하였다.
이론/모형
로지스틱회귀모형은 변수선정방법(selection method)으로 stepwise, 변수선정 기 준(selection criteria) 으로 '오 분류율 검정'(validation misclassilication)을 적용하여 평가용데이터에서 가장 작은 오 분류율을 갖는 모형을 선택하도록 하였다. 모형의 평가를 위해서는 이익도표(lift chart)를 사용하여 모형적중률과 예측 향상도를 측정하였다.
하였다. 모형의 평가를 위해서는 이익도표(lift chart)를 사용하여 모형적중률과 예측 향상도를 측정하였다.
성능/효과
8개 질병군 전체적으로는 모형적중률 60.7%, 예측향상도 4.1 로 예측되었다.
질병군별로 그 정도에는 차이가 있으나 평균적으로 약 4배의 예측 향상도를.기대할 수 있어서 향후 DRG 확인심사 건을 선정하는 과정에 데이터마이닝 기법이 유용하게 사용될 가능성을 보여주었다. 다만 입력변수의 제한점과 DRG 본사업 실시 후 일부 세부제도의 변경으로 인하여 실제 본사업의 확인심사건 선정시에는 예측향상도가 낮아질 가능성이 있다.
데이터마이닝 결과 질병군별로 구축된 모형을 살펴보면, 로지스틱회귀모형이 최적 모형인 경우가 4개 질병군, 의사결정 나무모형이 최적 모형인 경우가 3개 질병군, 신경망모형이 최적 모형인 경우가 1 개 질병군에서 나타났다. 그러나 이는 기존의 확인심사율을 그대로 적용하였을 때의 최적모형이므로 향후 확인심사 전략 및 구체적인 방법의 변동에 따라서 최적 모형은 변화될 수 있기 때문에 항시적인 최적 모형이라고 볼 수는 없으며 다만, 전체적으로 기대할 수 있는 예측 향상도를 보여준다고 하겠다.
서혜 및 대퇴부 탈장수술의 경우 현재 전체 청구건의 8.3%를 확인심사하고 있으며 이 중 약 9.1%에서 정산심사조정이 이루어지고 있는데, 데이터마이닝을 이용하여 전체 청구건의 8%만큼 확인심사를 할 때 의사결정나무모형에서 가장 최적의 결과를 보였으며 이 경우 모형적중률이 23.7%로 예측되었고 예측향상도는 2.6으로 예측되었다.
신경망 모형에서 중증도, 심결DRG번호, 매체 구분 등이 연결강도가 높은 변수로 나타났다.
신경망 모형에서 중증도, 지역코드, 행위별 요양 급여 비용총액 등이 연결강도가 높은 변수로 나타났다.
신경망모형에서 심결DRG번호, 중증도, 매체구분, 부상병 등이 연결 강도가 높은 변수로 나타났다.
신경망모형에서 심결DRG번호, 중증도, 입원일구분, 매체구분, 종별코드, 보험자구분 등이 연결강도가 높은 변수로 나타났다.
변수로 나타났다.신경망모형에서 주상병, 지역 코드, 요양기호, 지원코드 등이 연결 강도가 높은 변수로 나타났다.
나타났다. 신경망모형에서 중증도, 심결DRG번호, 분만병상수 등이 연결강도가 높은 변수로 나타났다.
신경망모형에서심결DRG번호, 중증도, 환자연령, 청구보험자부담금 등이 연결강도가 높은 변수로 나타났다.
연구대상 요양기관에 있어서 현재 본사업에 참여하고 있는 요양기관과 본 연구의 연구대상기간 동안 시범사업에 참여한 요양기관이 일부 상이하나 본 연구의 목적이 특정 요양기관의 부당청구 가능성을 산출하는 것이 아니라 일반적인 부당청구 가능성을 산출함으로써 확인심사대상 건 선정을 정확히 하는데 있으므로 연구결과에 미치는 영향은 거의 없을 것으로 판단하였다.
연구대상의 일반적인 청구, 확인심사, 정산심사조정의 현황을 살펴보면, 확인심사율이 질병군에 따라서 3.2%~13.2%까지 차이가 나타났다. 이는 지금까지 암묵적으로 알려진 정산심사조정대상건의 특성을 반영한 결과라고 생각된다.
예측향상도를 살펴보면 질병군별로 1.9~7.3까지, 평균 4.1배의 예측 향상도를 기대할 수 있었다. 그러나 향후 연구 결과 구축된 모형을 연구대상기간 이후의 청구 건에 적용시킨다면 연구결과의 예측향상도 보다는 낮은 예측향상도를 보일 가능성이 있다.
오히려 시범사업 평가결과 의료제공자의 수익 향상, 환자의 본인부담 경감, 진료비지급기 간의 단축, 항생제 등 자원소모량의 감소 등 긍정적인 효과가 큰 것으로 분석되었으며, 진료비 청구업무가 간편해졌고, 청구지급에 소요되는 기간이 대폭 간편해짐에 따라 청구와 지급, 그리고 진료비 심사에 관한 의료제공자의 만족도가 상당히 높은 것으로 나타났다 [1].
의 사결 정 나무모형 에서 요양기 호, 매 체구 분, 지원코드, 다액기관구분 등이 가지를 분지시키는 변수로 나타났고, 로지스틱 회귀모형에서 주상병이 유의한 변수로 나타났다.신경망모형에서 주상병, 지역 코드, 요양기호, 지원코드 등이 연결 강도가 높은 변수로 나타났다.
의사결정 나무모형과 로지스틱 회귀 모형에서 모형의 구축이 가능한 변수들이 선별되지 않았으나, 신경망모형에서 대표자 구분, 부상병 등이 연결강도가 높은 변수로 나타났다.
의사결정 나무모형에서 요양기 호, 청구 요양 급여 비용총액 지원코드 등이 가지를 분지시키는 변수로 나타났으며, 로지스틱 회귀모형에서 심결DRG번호, 환자연령, 요양기호 등이 유의한 변수로 나타났다. 신경망모형에서 중증도, 심결DRG번호, 분만병상수 등이 연결강도가 높은 변수로 나타났다.
의사결정 나무모형에서 요양기호, 지원 코드, 부상병 등이 가지를 분지시키는 변수로 나타났으며, 로지스틱 회귀모형에서심결DRG번호, 환자연령, 요양기호 등 이유의 한 변수로 나타났다. 신경망 모형에서 중증도, 지역코드, 행위별 요양 급여 비용총액 등이 연결강도가 높은 변수로 나타났다.
의사결정 나무모형에서 중증도, 의사수, 요양기호, 부상병 등이 가지를 분지시키는 변수로, 그리고 로지스틱 회귀모형에서 중증도, 지원코드 등이 유의한 변수로 나타났다. 신경망모형에서 심결DRG번호, 중증도, 입원일구분, 매체구분, 종별코드, 보험자구분 등이 연결강도가 높은 변수로 나타났다.
의사결정나무모형에서 부상병 , 중증도 등이 가지를 분지시키는 변수로, 그리 고로지 스틱 회 귀 모형 에서 중증도, 요양기 호 등이 유의한 변수로 나타났다. 신경망 모형에서 중증도, 심결DRG번호, 매체 구분 등이 연결강도가 높은 변수로 나타났다.
의사결정나무모형에서 심결DRG번호, 지역코드 등이 가지를 분지시키는 변수로 나타났으며, 로지스틱회귀모형에서 심결DRG번호, 매체구분, 요양기호 등이 유의한 변수로 나타났다. 신경망모형에서심결DRG번호, 중증도, 환자연령, 청구보험자부담금 등이 연결강도가 높은 변수로 나타났다.
의사결정나무모형에서 심결DRG번호, 청구본인부담금, 주상병, 지원코드, 중증도 등이 가지를 분지시키는 변수로 나타났으며, 로지스틱회귀모형에서 심결DRG 번호, 청 구본인부담금, 청 구요양급여 비 용 총액, 요양기호 등이 유의한 변수로 나타났다. 신경망모형에서 심결DRG번호, 중증도, 매체구분, 부상병 등이 연결 강도가 높은 변수로 나타났다.
2%를 확인심사하고 있으며 .이 중 약 13.9%에서 정산심사조정이 이루어지고 있는데, 데이터마이닝을 이용하여 전체 청구건의 13%만큼 확인심사를 할 때 의사결정나무모형에서 가장 최적의 결과를 보였으며 이 경우 모형적중률이 39.3%로 예측되었고 예측향상도는 2.8로 예측되었다.
5%에서 정산심사조정이 이루어지고 있다. 이에 대해 데이터마이닝을 이용하여 전체 청구건의 4%만큼 확인심사를 할 때 의사결정나무모형에서 가장 최적의 결과를 보였으며, 이 경우 모형적중률이 69.4%로 예측되었고 예측향상도는 7.3으로 예측되었다.
제왕절개분만의 경우 현재 전체 청구 건의 4.8%를 확인심사하고 있으며 이 중 17.9%에서 정산심사조정이 이루어지고 있는데, 데이터마이닝을 이용하여 전체청구 건의 5%만큼 확인심사를 할 때 로지스틱 회귀모형에서 가장 최적의 결과를 보였으며 이 경우 모형적중률이 66.6%로 예측되었고 예측향상도는 3.7로 예측되었다.
질병군별로 각 모형에서 유의한 변수로 심결DRG번호가 빈번하게 나타났는데, 이는 같은 질병군내에서도 DRG번호에 따라서 전반적인 청구행태의 변이가 큼을 보여준다고 하겠다. 향후 질병 군별분석뿐만 아니라 DRG청구건 전체를 분석단위로 하여 데이터마이닝 기법을 적용할 필요성을 시사하는 부분으로 생각된다.
질식분만의 경우 현재 전체 청구건의 3.7%를 확인심사하고 있으며 이 중 약 12.3%에서 정산심사조정이 이루어지고 있는데, 데이터마이닝을 이용하여 전체청구 건의 4%만큼 확인심사를 할 때 로지스틱 회귀모형에서 가장 최적의 결과를 보였으며 이 경우 모형적중률이 60.1%로 예측되었고 예측향상도는 4.9로 예측되었다.
6%인 79,790건이 확인심사되었다. 청구건수 대비 확인심사 건수로 정의되는 확인심사율(examination rate)은 자궁 및 자궁부속기수술, 충수절제술, 서혜 및 대퇴부 탈장 수술의 경우 평균보다 높았고, 편도와(또는) 아데노이드 절제술, 질식분만, 수정체 단안 수술, 제왕절개분만 등의 경우는 평균보다 낮았다.
충수절제술의 경우 현재 전체 청구 건의 11.5%를 확인심사하고 있으며 이 중 20.4%에서 정산심사조정이 이루어지고 있는데, 데이터마이닝을 이용하여 전체청구 건의 12%만큼 확인심사를 할 때 로지스틱 회귀모형을 사용하는 경우가 가장 최적의 결과를 보였으며 이 경우 모형적중률이 47.7%로 예측되었고 예측향상도 는 2.3으로 예측되었다.
편도와(또는) 아데노이드 절제술의 경우 현재 전체 청구건의 3.2%를 확인 심사하고 있으며 이 중 약 8.1%에서 정산심사조정이 이루어지고 있는데, 데이터마이닝을 이용하여 전체 청구건의 3%만큼 확인심사를 할 때 신경망모형에서 모형적중률이 15.4%로 예측되었고 예측향상도는 1.9로 예측되었다.
항문수술의 경우 현재 전체 청구건의 5.5%를 확인심사하고 있으며 이 중 약 14.9%에서 정산심사조정이 이루어지고 있는데, 데이터마이닝을 이용하여 전체청구 건의 6%만큼 확인심사를 할 때 로지스틱 회귀모형에서 가장 최적의 결과를 보였으며 이 경우 모형적중률:이 81.9%로 예측되었고 예측향상도는 5.5로 예측되었다.
확인심사건의 14.7%인 11, 723건에서 정산심사조정 이 이루어 졌으며 , 확인심사 건수 대비 정산심사조정건수로 정의되는 정산심사조정률(correction rate)은 충수절제술, 제왕절개분만, 항문과(또는) 항문 주위 수술의 경우 평균보다 높았고, 편도와(또는) 아데노이드 절제술, 서혜 및 대퇴부 탈장수술, 수정체수술, 질식분만 등의 경우 평균보다 낮았다 (Table 1).
후속연구
1배의 예측 향상도를 기대할 수 있었다. 그러나 향후 연구 결과 구축된 모형을 연구대상기간 이후의 청구 건에 적용시킨다면 연구결과의 예측향상도 보다는 낮은 예측향상도를 보일 가능성이 있다. 이는 과거의 자료를 이용하여 미래의 결과를 예측하고자 하는 데이터마이닝 방법론의 한계이기도 하다 [12], 따라서 실제로 연구대상자료가 아닌 청구건에 대하여 적용하고 그 결과를 반영하여 모형을 조정하는 작업이 계속적으로 이루어질 필요성이 있다.
데이터마이닝 모형 구축을 위한 입력변수를 선정하는데 있어서는 요양기관 자료 및 청구자료 외에 세무자료, 행정처분자료 등 건강보험과 직접적으로 관련이 없는 자료를 함께 분석하는 것이 더욱 효과적이라는 외국의 연구결과 [기가 있었으나 본 연구에서는 적용하지 못하였다.
둘째, 모형 구축을 위한 목표변수로 정산심사조정 여부만을 상정하였으나 확인심사의 의의가 단순히 정산심사조정 건을 발견하는 데만 있는 것이 아니라 부당한 보험료 지출을 최소화하는데 역시 의의가 있기에 추후 목표변수를 정산심사조정액으로 상정하고 분석할 필요가 남아있다.
보여준다고 하겠다. 향후 질병 군별분석뿐만 아니라 DRG청구건 전체를 분석단위로 하여 데이터마이닝 기법을 적용할 필요성을 시사하는 부분으로 생각된다.
참고문헌 (15)
서울대학교 의과대학 의료관리학교실 . DRG 지불제도 시범사업 평가 및 개선방안 연구; 2000, (205-300쪽)
Hsia DC, Ahern CA, Ritchie BP, Moscoe LM, Krushat WM. Medicare reimburse-ment accuracy under the prospective payment system, 1985 to 1988. JAMA 1992; 268(7): 896-899
Carter GM, Newhouse JP, Relles DA. How much change in the case mix index in DRG creep? J Health Econ 1990.; 9(4): 411-428
Ho SH, Chae YM, Choi MY, Song MR. Development of critical pathway for the cesarean section using data mining. J Korean soc med inform 2002; 8(2): 41-68 (Korean)
Suhn MO, Chae YM, Lee HJ, Lee SH, Kang SH, Ho SH. An application of data mining approach to CQI using the dis-charge summary. J Korean soc med inform 2000; 6(4): 1-13 (Korean)
Kim ON, Kim YH, Kang SH, Kim SH. A study on effects of critical pathway prac-tices by using BSC and datamining me-thod. J Korean soc med inform 2002; 8(2): 51-68(Korean)
※ AI-Helper는 부적절한 답변을 할 수 있습니다.