본 연구의 목적은 현재 질병관리본부에서 사용하고 있는 건강보험 청구자료 기반의 결핵환자 분류기준을 고도화하여 보다 효과적인 결핵환자감시체계의 토대를 제공하기 위해 수행되었다. 이를 위해 건강보험심사평가원의 2009년 1년간 결핵상병으로 청구된 81,199명 중 10%인 8,118명을 표본추출한 후 실제 결핵환자인지에 대해서 의무기록 조사를 실시하여 조사가 완료되고, 국민건강보험공단 건강보험청구 자료와 매칭이 완료된 7,132명을 최종 분석대상자로 하였다. 결핵환자분류를 위한 모형을 개발하여 평가한 결과 결핵과 관련된 임상전문가 의견과 통계적 분류 알고리즘이 종합적으로 고려된 의사결정나무모형이 가장 우수한 모형으로 평가되었다. 의사결정나무 모형에 따른 결핵분류모형의 주요 독립변수는 연령, 최초 청구시점의 결핵약제 종류수, 최초 청구시점의 이용 의료기관 유형, 최초 청구시점의 청구결핵검사 종류, 2008년 결핵약 투약일수, 최초 청구시점 결핵약제 투약일수, 최초 청구시점 결핵상병 종류로 나타났다. 이 모형의 향상도는 최고 11.8이였으며, 개발된 모형에서 분류된 1~5유형까지 적용하여 청구된 자료 중 결핵이 아님을 예측할 경우, 민감도는 90.6%, 양성예측도는 96.1%, 정분류율은 87.6%로 나타나, 현재 질병관리본부에서 사용하는 청구2회 이상, 약제 2제 이상 모형(민감도 82.6%, 양성예측도 95%, 정분류율 80%)보다 우수한 모형인 것으로 나타났다.
본 연구의 목적은 현재 질병관리본부에서 사용하고 있는 건강보험 청구자료 기반의 결핵환자 분류기준을 고도화하여 보다 효과적인 결핵환자감시체계의 토대를 제공하기 위해 수행되었다. 이를 위해 건강보험심사평가원의 2009년 1년간 결핵상병으로 청구된 81,199명 중 10%인 8,118명을 표본추출한 후 실제 결핵환자인지에 대해서 의무기록 조사를 실시하여 조사가 완료되고, 국민건강보험공단 건강보험청구 자료와 매칭이 완료된 7,132명을 최종 분석대상자로 하였다. 결핵환자분류를 위한 모형을 개발하여 평가한 결과 결핵과 관련된 임상전문가 의견과 통계적 분류 알고리즘이 종합적으로 고려된 의사결정나무모형이 가장 우수한 모형으로 평가되었다. 의사결정나무 모형에 따른 결핵분류모형의 주요 독립변수는 연령, 최초 청구시점의 결핵약제 종류수, 최초 청구시점의 이용 의료기관 유형, 최초 청구시점의 청구결핵검사 종류, 2008년 결핵약 투약일수, 최초 청구시점 결핵약제 투약일수, 최초 청구시점 결핵상병 종류로 나타났다. 이 모형의 향상도는 최고 11.8이였으며, 개발된 모형에서 분류된 1~5유형까지 적용하여 청구된 자료 중 결핵이 아님을 예측할 경우, 민감도는 90.6%, 양성예측도는 96.1%, 정분류율은 87.6%로 나타나, 현재 질병관리본부에서 사용하는 청구2회 이상, 약제 2제 이상 모형(민감도 82.6%, 양성예측도 95%, 정분류율 80%)보다 우수한 모형인 것으로 나타났다.
The aim of this study was to enhance the NHI claims data-based tuberculosis classification rule of KCDC(Korea centers for disease control & prevention) for an effective TB surveillance system. 8,118 cases, 10% samples of 81,199 TB cases from NHI claims data during 2009, were subject to the Medical R...
The aim of this study was to enhance the NHI claims data-based tuberculosis classification rule of KCDC(Korea centers for disease control & prevention) for an effective TB surveillance system. 8,118 cases, 10% samples of 81,199 TB cases from NHI claims data during 2009, were subject to the Medical Record Survey about whether they are real TB patients. The final study population was 7,132 cases whose medical records were surveyed. The decision tree model was evaluated as the most superior TB patients detection model. This model required the main independent variables of age, the number of anti-tuberculosis drugs, types of medical institution, tuberculosis tests, prescription days, types of TB. This model had sensitivity of 90.6%, PPV of 96.1%, and correct classification rate of 93.8%, which was better than KCDC's TB detection model with two or more NHI claims for TB and TB drugs(sensitivity of 82.6%, PPV of 95%, and correct classification rate of 80%).
The aim of this study was to enhance the NHI claims data-based tuberculosis classification rule of KCDC(Korea centers for disease control & prevention) for an effective TB surveillance system. 8,118 cases, 10% samples of 81,199 TB cases from NHI claims data during 2009, were subject to the Medical Record Survey about whether they are real TB patients. The final study population was 7,132 cases whose medical records were surveyed. The decision tree model was evaluated as the most superior TB patients detection model. This model required the main independent variables of age, the number of anti-tuberculosis drugs, types of medical institution, tuberculosis tests, prescription days, types of TB. This model had sensitivity of 90.6%, PPV of 96.1%, and correct classification rate of 93.8%, which was better than KCDC's TB detection model with two or more NHI claims for TB and TB drugs(sensitivity of 82.6%, PPV of 95%, and correct classification rate of 80%).
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 건강보험 청구 자료를 이용하여 결핵환자 분류 모형을 개발하고, 이를 기반으로 효율적인 결핵환자감시체계의 기초 방안을 제시하고자 한다.
결핵으로 진료를 받은 자가 실제 결핵환자인지를 확인하는 조사를 위해서 체계적인 표본추출방법에 따라서 표본을 추출하였다. 표본추출 대상자는 전체 모집단의 10%인 8,118명으로 하였다.
제안 방법
우리나라의 질병관리본부에서도 낮은 결핵 신고율 문제를 해결하기 위하여 건강보험청구 자료를 이용하여 결핵환자를 분류하는 방법을 개발하였다. 질병관리본부가 개발한 건강보험청구 환자 중 결핵환자로 추정하는 분류기준은 결핵상병으로 청구된 자 중 결핵약제 2제 이상, 청구 2회 이상인 자였다.
표본추출 대상자는 전체 모집단의 10%인 8,118명으로 하였다. 조사내용의 특성과 모집단의 대표성을 높이기 위해 1차 표본추출 단위인 의료기관에 대하여 지역, 의료기관 종, 규모(환자 수 기준)를 층으로 고려하였다. 2차 표본추출 단위인 환자에 대하여 상병분류를 층으로 고려하였고, 의료기관 종별로 모집단 환자수의 약 10%씩을 할당한 후 의료기관 종 내에서 지역별로 할당하였다.
조사내용의 특성과 모집단의 대표성을 높이기 위해 1차 표본추출 단위인 의료기관에 대하여 지역, 의료기관 종, 규모(환자 수 기준)를 층으로 고려하였다. 2차 표본추출 단위인 환자에 대하여 상병분류를 층으로 고려하였고, 의료기관 종별로 모집단 환자수의 약 10%씩을 할당한 후 의료기관 종 내에서 지역별로 할당하였다. 그리고 각 의료기관 내에서 상병분류별 추출률이 동일하도록 할당하였다.
그리고 각 의료기관 내에서 상병분류별 추출률이 동일하도록 할당하였다. 또한 성과 연령은 모수추정을 위한 사후층화 변수로 고려하였다.
표본추출 환자에 대한 의무기록 조사는 종합병원과 병원의 경우 조사 대상 의료기관에 의무기록실이 있는 경우에는 자체조사를 통하여 대한의무기록협회에 조사자료를 제출하고, 그렇지 않은 기관에 대해서는 조사원을 파견하여 조사하는 체계에 근거하여 조사를 실시하였다. 의원에 대한 조사는 보건소를 통하여 수집된 결핵의심환자의 의무기록 사본을 대한의무기록협회로 전달 받아, 파견 조사원들이 대한의무기록협회의 사무국으로 파견되어 조사를 시행하였으며, 조사 시행 후 의무기록사본을 안전하게 파기하였다.
본 연구에서 결핵환자 분류모형은 최초 결핵상병으로 청구되었을 때, 해당 환자가 실제 결핵환자인지 아닌지를 판별하기 위한 모형으로 아래의 방법에 따라 최종 분석대상자를 정의하고 이에 따라 분석DB를 구축하였다.
의무기록조사 자료와 건강보험청구 DB를 이용하여 최종 분석용 DB를 구축하였다. 의무기록조사를 통해 나타난 개인별 결핵상병 최종 판정유무 변수가 종속변수로 사용되었으며, 성별, 연령, 상병, 의료기관 유형, 총 결핵약제 종류 수(2009년 최초 청구시점), 각 결핵약제 사용유무(2009년 최초 청구시점, 17개 약제), 총 결핵약제 처방일수(2009년 최초 청구시점, 17개 약제), 각 결핵약제 처방일수(2009년 최초 청구시점, 17개 약제), 총 결핵검사 종류 수(2009년 최초 청구시점, 18개 검사), 각 결핵검사 유무(2009년 최초 청구시점, 18개 검사), 총 결핵약제 종류 수(2008년 전체), 총 결핵약제 처방일수(2008년 전체), 총 결핵검사 건수(2008년 전체)가 독립변수로 선정되었다.
결핵환자 분류 모형은 데이터마이닝의 SEMMA(Sampling, Explore, Modify, Model, Assess)라는 방법론에 따라 모형을 개발하였다. 표본추출(Sampling)단계에서 분석용 자료는 훈련용 60%, 검증용 40%로 각각 임의표본을 추출한 후, 훈련용을 통해 모형을 개발하고 검증용을 통해 모형을 평가하였다.
결핵환자 분류 모형은 데이터마이닝의 SEMMA(Sampling, Explore, Modify, Model, Assess)라는 방법론에 따라 모형을 개발하였다. 표본추출(Sampling)단계에서 분석용 자료는 훈련용 60%, 검증용 40%로 각각 임의표본을 추출한 후, 훈련용을 통해 모형을 개발하고 검증용을 통해 모형을 평가하였다. 모형개발은 의사결정나무, 로지스틱회귀모형, 신경망 기법 등을 이용하였다.
모형개발은 의사결정나무, 로지스틱회귀모형, 신경망 기법 등을 이용하였다. 이때 결핵환자가 아닌 자가 5.5%에 불과함에 따라 결핵환자가 아닌 자를 찾기 위한 모형화를 실시하였다. 결핵 분류 모형에 사용한 각 통계기법의 우수성 평가를 위해 RASE(Root Average Squared Error), 오분류율(Misclassification Rate) 값을 비교하였으며, 최종 모형의 선택에 있어서는 통계적 결과의 우수성을 비롯하여 모형해석의 용이성을 함께 고려하였다.
결핵 분류 모형에 사용한 각 통계기법의 우수성 평가를 위해 RASE(Root Average Squared Error), 오분류율(Misclassification Rate) 값을 비교하였으며, 최종 모형의 선택에 있어서는 통계적 결과의 우수성을 비롯하여 모형해석의 용이성을 함께 고려하였다. 또한 최종 선택된 모형과 기존에 개발된 모형결과와의 비교를 위해 향상도, 민감도, 양성예측도, 정분류율을 제시하였다.
결핵청구자료 기반의 결핵환자 분류를 위한 대상자 7,132명 중 94.5%인 6,741명이 최종 결핵상병으로 이환된 자임에 따라, 모형개발을 통해 결핵환자가 아닐 확률이 높은 환자를 제외하는 방법을 적용하였다. 모형개발을 위해 사용된 독립변수는 선행된 일반적 특성, 항 결핵약제 및 결핵 검사에 따른 실제 결핵상병 이환유무에서 통계적으로 유의한 변수로 구성하였다.
5%인 6,741명이 최종 결핵상병으로 이환된 자임에 따라, 모형개발을 통해 결핵환자가 아닐 확률이 높은 환자를 제외하는 방법을 적용하였다. 모형개발을 위해 사용된 독립변수는 선행된 일반적 특성, 항 결핵약제 및 결핵 검사에 따른 실제 결핵상병 이환유무에서 통계적으로 유의한 변수로 구성하였다. 또한 모형의 일반화를 위해 전체 데이터셋을 모형개발용 60%, 모형평가용 40%로 구분하였으며, 모형개발용 데이터셋에 의사결정나무 2가지 형태, 로지스틱 회귀모형, 신경망 모형을 적용시켰으며, 적용된 모형 중 가장 최적의 모형을 선택하기 위해 RASE(Root Average Squared Error) 및 오분류율(Misclassification Rate) 그리고 모형 해석의 용이성 등을 고려하였다.
모형개발을 위해 사용된 독립변수는 선행된 일반적 특성, 항 결핵약제 및 결핵 검사에 따른 실제 결핵상병 이환유무에서 통계적으로 유의한 변수로 구성하였다. 또한 모형의 일반화를 위해 전체 데이터셋을 모형개발용 60%, 모형평가용 40%로 구분하였으며, 모형개발용 데이터셋에 의사결정나무 2가지 형태, 로지스틱 회귀모형, 신경망 모형을 적용시켰으며, 적용된 모형 중 가장 최적의 모형을 선택하기 위해 RASE(Root Average Squared Error) 및 오분류율(Misclassification Rate) 그리고 모형 해석의 용이성 등을 고려하였다. 그 결과, 훈련용에서 RASE값과 오분류율이 가장 적고, 모형이 가장 안정적인 것으로 판단되는 의사결정나무 1을 최종 모형으로 선택하였다.
결핵청구자료 기반의 결핵환자 분류를 위한 의사결정나무모형에 대한 결과를 향상도, 민감도, 양성예측도, 정분류율로 평가하였다. 그 결과 개발된 모형을 향상도 측면에서 살펴보면, 최초 누적 결핵 제외 적발률이 5.
최초 건강보험 청구 시, 해당 청구 건이 실제 결핵 청구 건인지 아닌지를 판별하기 위해 2009년 최초 청구시점에서의 건강보험 결핵 청구 자료와 이에 대한 사실 확인조사를 거친 의무기록조사를 서로 매칭하여 최종 분석용 DB를 구축하였다. 이 자료에 4가지 데이터마이닝 기법을 적용시킨 후, 모형의 안정성, 효과성 그리고 해석의 용이성 등을 평가하여 최종 건강보험 청구기반 결핵환자 분류모형을 결정하였다.
최초 건강보험 청구 시, 해당 청구 건이 실제 결핵 청구 건인지 아닌지를 판별하기 위해 2009년 최초 청구시점에서의 건강보험 결핵 청구 자료와 이에 대한 사실 확인조사를 거친 의무기록조사를 서로 매칭하여 최종 분석용 DB를 구축하였다. 이 자료에 4가지 데이터마이닝 기법을 적용시킨 후, 모형의 안정성, 효과성 그리고 해석의 용이성 등을 평가하여 최종 건강보험 청구기반 결핵환자 분류모형을 결정하였다. 최종 결정된 모형은 결핵에 영향을 줄 수 있는 최종 변수선택에 대한 임상전문가 의견과 통계적 분류 알고리즘이 복합적으로 고려된 의사결정나무모형(Interactive)으로서, 이 모형을 건강보험 최초 청구 자료에 적용할 시 모형 적용 전에 비해 청구건 중 결핵 청구 건이 아님을 찾아낼 수 있는 확률이 최고 11.
두 번째로, 최종 선정된 결핵청구자료 기반의 결핵환자 분류를 위한 의사결정나무모형의 결핵분류 기준에 따른 민감도2), 양성예측도3), 정분류율4)을 분석하였다. 1 유형을 결핵 아님으로 분류하는 경우의 민감도는 100%, 양성예측도는 95.
대상 데이터
건강보험심사평가원의 요양급여청구 자료에서 2009년 1년 간 진료 받은 청구자료 중 상병코드가 A15∼A19(결핵), U88.0∼U88.1(다제내성 및 광범위 내성결핵)에 해당되는 361,138건의 자료를 추출하였다.
결핵으로 진료를 받은 자가 실제 결핵환자인지를 확인하는 조사를 위해서 체계적인 표본추출방법에 따라서 표본을 추출하였다. 표본추출 대상자는 전체 모집단의 10%인 8,118명으로 하였다. 조사내용의 특성과 모집단의 대표성을 높이기 위해 1차 표본추출 단위인 의료기관에 대하여 지역, 의료기관 종, 규모(환자 수 기준)를 층으로 고려하였다.
첫째, 국민건강보험공단으로부터 제공받은 자료 중 2009년 결핵상병(주상병 또는 부상병)으로 청구된 건강보험 자료를 추출하였다. 우리나라의 경우, 입원 및 외래를 거쳐 약국 진료를 받기 때문에 자료의 중복을 막기 위해 약국은 제외하였다.
셋째, 위 단계에서 추출된 환자단위 자료와 의무기록조사가 완료된 자의 자료(7,459명)를 서로 매칭한 결과, 서로 매칭이 완료된 7,132명이 최종 분석대상자로 선정되었다. 327명의 자료가 서로 매칭되지 않는 이유는 개인정보 보호 때문에 의무기록조사자료(건강보험심사평가원에서 제공된 건강보험 청구와 관련된 상세정보 포함됨)에는 주민등록번호 등 인적사항 정보를 가지고 있지 않고, 건강보험 청구명세서 번호 등만이 존재함에 따라 이를 이용하여 자료를 매칭 하였기 때문이다.
데이터처리
5%에 불과함에 따라 결핵환자가 아닌 자를 찾기 위한 모형화를 실시하였다. 결핵 분류 모형에 사용한 각 통계기법의 우수성 평가를 위해 RASE(Root Average Squared Error), 오분류율(Misclassification Rate) 값을 비교하였으며, 최종 모형의 선택에 있어서는 통계적 결과의 우수성을 비롯하여 모형해석의 용이성을 함께 고려하였다. 또한 최종 선택된 모형과 기존에 개발된 모형결과와의 비교를 위해 향상도, 민감도, 양성예측도, 정분류율을 제시하였다.
이론/모형
표본추출(Sampling)단계에서 분석용 자료는 훈련용 60%, 검증용 40%로 각각 임의표본을 추출한 후, 훈련용을 통해 모형을 개발하고 검증용을 통해 모형을 평가하였다. 모형개발은 의사결정나무, 로지스틱회귀모형, 신경망 기법 등을 이용하였다. 이때 결핵환자가 아닌 자가 5.
성능/효과
의사결정나무 모형에 따른 결핵분류모형의 주요 독립변수는 연령, 최초 청구시점의 결핵약제 종류 수, 최초 청구시점의 이용 의료기관 유형, 최초 청구시점의 청구결핵검사 종류, 2008년 결핵약 투약일수, 최초 청구시점 결핵약제 투약일수, 최초 청구시점 결핵상병 종류로 나타났다. 또한, 이러한 특성이 종합적으로 반영되어 분류된 유형은 모두 10개로 나타났다.
결핵환자 분류 기준에 부합되는 자 중 실제 결핵환자의 비율은 95-97%수준임에 따라 합리적인 기준이라는 것이 입증되었다[7,8]. 즉, 이 기준을 적용하여 건강보험 환자 중 결핵환자를 추정할 경우 기존의 결핵신고감시체계를 이용하여 결핵환자를 분류하는 것 보다 결핵환자의 누락을 막을 수 있는 효율적인 시스템이라는 것이 입증되었다.
의무기록조사 자료와 건강보험청구 DB를 이용하여 최종 분석용 DB를 구축하였다. 의무기록조사를 통해 나타난 개인별 결핵상병 최종 판정유무 변수가 종속변수로 사용되었으며, 성별, 연령, 상병, 의료기관 유형, 총 결핵약제 종류 수(2009년 최초 청구시점), 각 결핵약제 사용유무(2009년 최초 청구시점, 17개 약제), 총 결핵약제 처방일수(2009년 최초 청구시점, 17개 약제), 각 결핵약제 처방일수(2009년 최초 청구시점, 17개 약제), 총 결핵검사 종류 수(2009년 최초 청구시점, 18개 검사), 각 결핵검사 유무(2009년 최초 청구시점, 18개 검사), 총 결핵약제 종류 수(2008년 전체), 총 결핵약제 처방일수(2008년 전체), 총 결핵검사 건수(2008년 전체)가 독립변수로 선정되었다.
분석대상자 7,132명에 대하여 일반적 특성을 파악한 결과, 성별에 따른 분포는 남자가 57.4%, 여자가 42.6%로 남자가 높았으며, 이용 의료기관 종별로는 종합병원 이상이 74.1%로 가장 높게 나타났고 그 다음으로 의원 13.4%, 일반병원 12.1% 순이었다. 연령별 분포는 60대 이상이 34.
분석대상자의 17개의 항결핵약제 별 처방 현황(최초 청구시점)을 살펴본 결과, Rifampicin 35.9%, Isoniazid 35.9%, Pyrazinamide 30.4%, Ethambutol 27.6%, Cycloserine 3.9%, Clarithromycin을 받은 자 3.7% 순으로 나타났다[표 2].
18개의 결핵검사 현황(최초 청구시점)을 파악한 결과, 객담배양(고체배지) 52.3%, 객담배양 24.9%, PCR 20.9%, 미생물현미경검사(항산성 집균도말검사 Acid Fast Stain) 20.7%, 약제감수성 검사를 받은 자가 19.8% 순으로 높게 나타났다[표 3].
최초 청구시점에서의 항결핵약제 평균 처방일수를 살펴본 결과, Isoniazid 8.0일, Rifampicin 7.9일, Pyrazinamide 6.1일, Ethambutol 5.9일 순으로 나타났다. 최초 청구시점 총 결핵약제 종류의 평균 개수는 1.
9일 순으로 나타났다. 최초 청구시점 총 결핵약제 종류의 평균 개수는 1.56개, 총 결핵약제 평균 처방일수는 32.5일, 총 결핵검사 종류의 평균 개수는 2.6개로 나타났고, 2008년 처방된 총 결핵약제 종류의 평균 개수, 총 결핵약제 평균 처방일수, 실시된 총 결핵검사 종류의 평균 개수는 각각 1.7개, 53.8일, 1.4개로 나타났다[표 4].
또한 모형의 일반화를 위해 전체 데이터셋을 모형개발용 60%, 모형평가용 40%로 구분하였으며, 모형개발용 데이터셋에 의사결정나무 2가지 형태, 로지스틱 회귀모형, 신경망 모형을 적용시켰으며, 적용된 모형 중 가장 최적의 모형을 선택하기 위해 RASE(Root Average Squared Error) 및 오분류율(Misclassification Rate) 그리고 모형 해석의 용이성 등을 고려하였다. 그 결과, 훈련용에서 RASE값과 오분류율이 가장 적고, 모형이 가장 안정적인 것으로 판단되는 의사결정나무 1을 최종 모형으로 선택하였다.
의사결정나무 모형에 따른 결핵분류모형의 주요 독립변수는 연령, 최초 청구시점의 결핵약제 종류 수, 최초 청구시점의 이용 의료기관 유형, 최초 청구시점의 청구결핵검사 종류, 2008년 결핵약 투약일수, 최초 청구시점 결핵약제 투약일수, 최초 청구시점 결핵상병 종류로 나타났다. 또한, 이러한 특성이 종합적으로 반영되어 분류된 유형은 모두 10개로 나타났다. 1유형은 40대 이하 & 청구시점 보건기관 이용 환자군, 2유형은 50대 이상 & 청구시점 결핵약 2회 이하 & 청구시점 결핵검사 2회 이하 & 청구시점 Primary 결핵상병 환자군, 3유형은 50대 이상 & 청구시점 결핵약 2회 이하 & 청구시점 결핵검사 2회 이하 & 청구시점 Primary 이외 결핵상병 & 2008년 결핵약 투약일수 6개월 이상 & 청구시점 pulmonary 결핵상병 환자군 이였다.
이 자료에 4가지 데이터마이닝 기법을 적용시킨 후, 모형의 안정성, 효과성 그리고 해석의 용이성 등을 평가하여 최종 건강보험 청구기반 결핵환자 분류모형을 결정하였다. 최종 결정된 모형은 결핵에 영향을 줄 수 있는 최종 변수선택에 대한 임상전문가 의견과 통계적 분류 알고리즘이 복합적으로 고려된 의사결정나무모형(Interactive)으로서, 이 모형을 건강보험 최초 청구 자료에 적용할 시 모형 적용 전에 비해 청구건 중 결핵 청구 건이 아님을 찾아낼 수 있는 확률이 최고 11.8배 이상인 것으로 분석되었다. 또한, 개발된 모형에서 분류된 1~5유형까지 적용하여 청구된 자료 중 결핵이 아님을 예측할 경우, 민감도는 90.
8배 이상인 것으로 분석되었다. 또한, 개발된 모형에서 분류된 1~5유형까지 적용하여 청구된 자료 중 결핵이 아님을 예측할 경우, 민감도는 90.6%, 양성예측도는 96.1%, 정분류율은 87.6%로 나타나 현재 질병관리본부에서 사용하는 청구2회 이상, 약제 2제 이상 모형(민감도 82.6%, 양성예측도 95%, 정분류율 80%)보다 우수한 모형인 것으로 나타났다. 즉, 건강보험 청구 자료를 이용하여 결핵환자를 조기에 발견하여 관리하는 새로운 형태의 결핵감시시스템이 본 연구결과를 통해 그 신뢰성이 판명되었으며, 이에 따라 향후에는 건강보험청구 자료를 이용하여 결핵환자를 분류해주는 결핵감시시스템의 구축 및 이를 기반으로 한 결핵환자 관리사업 수행이 필요할 것으로 보인다.
결핵환자 분류모형에 따른 유형별 결핵제외 적발률을 살펴보면, 유형 1의 경우, 결핵제외 적발률은 60.0%, 유형 2의 결핵제외 적발률은 33.3%, 유형 3의 결핵제외 적발률은 17.4%, 유형 4의 결핵제외 적발률은 15.8%, 유형 5의 결핵제외 적발률은 13.8%, 유형 6의 결핵제외 적발률은 5.5%, 유형 7의 결핵제외 적발률은 4.8%, 유형 8의 결핵제외 적발률은 4.3%, 유형 9의 결핵제외 적발률은 3.0%, 유형 10의 결핵제외 적발률은 2.2%로 나타났다. 즉, 본 모형을 통해 결핵청구시점에서 실제 결핵환자를 찾고자 할 경우, 유형 1에 해당되는 결핵환자 중 60%는 결핵환자가 아닌 것으로 판단할 수 있는 것이다.
결핵청구자료 기반의 결핵환자 분류를 위한 의사결정나무모형에 대한 결과를 향상도, 민감도, 양성예측도, 정분류율로 평가하였다. 그 결과 개발된 모형을 향상도 측면에서 살펴보면, 최초 누적 결핵 제외 적발률이 5.1%인데 반해, 결핵 제외 적발률이 가장 높은 유형 1에 해당될 시, 최초 결핵 청구 건에서 잘못된 결핵청구 건을 제외할 확률이 60%이며, 이는 모형을 적용하기 전에 비해 11.8배 높은 적발률이다. 또한, 유형 2의 경우는 최초 결핵 제외 적발률에 비해 8.
8배 높은 적발률이다. 또한, 유형 2의 경우는 최초 결핵 제외 적발률에 비해 8.4배 높은 향상도를 나타냈다. 본 연구에서 개발된 결핵청구자료 기반의 결핵환자 분류모형을 최초 청구 시점의 결핵 청구 건에 적용할 시, 적용하고자 하는 유형에 따라 최초 결핵청구건 제외확률 대비 그 향상도 수준은 변화하겠으나, 유형 1~5만을 적용한다고 가정할 경우, 청구 건에서 실제 결핵이 아닌 청구 건을 제외할 확률이 3배 이상 높은 것으로 나타났다.
4배 높은 향상도를 나타냈다. 본 연구에서 개발된 결핵청구자료 기반의 결핵환자 분류모형을 최초 청구 시점의 결핵 청구 건에 적용할 시, 적용하고자 하는 유형에 따라 최초 결핵청구건 제외확률 대비 그 향상도 수준은 변화하겠으나, 유형 1~5만을 적용한다고 가정할 경우, 청구 건에서 실제 결핵이 아닌 청구 건을 제외할 확률이 3배 이상 높은 것으로 나타났다.
을 분석하였다. 1 유형을 결핵 아님으로 분류하는 경우의 민감도는 100%, 양성예측도는 95.0%, 정분류율은 94.9%로 나타났으며, 1, 2 유형을 결핵 아님으로 분류하는 경우의 민감도는 99.8%, 양성예측도는 95.0%, 정분류율은 94.9%로 나타났다. 결과적으로 유형이 누적될수록, 민감도, 양성예측도 그리고 정분류율은 점차 낮아져 모형의 성능이 저하되는 것으로 나타났다.
9%로 나타났다. 결과적으로 유형이 누적될수록, 민감도, 양성예측도 그리고 정분류율은 점차 낮아져 모형의 성능이 저하되는 것으로 나타났다.
후속연구
6%, 양성예측도 95%, 정분류율 80%)보다 우수한 모형인 것으로 나타났다. 즉, 건강보험 청구 자료를 이용하여 결핵환자를 조기에 발견하여 관리하는 새로운 형태의 결핵감시시스템이 본 연구결과를 통해 그 신뢰성이 판명되었으며, 이에 따라 향후에는 건강보험청구 자료를 이용하여 결핵환자를 분류해주는 결핵감시시스템의 구축 및 이를 기반으로 한 결핵환자 관리사업 수행이 필요할 것으로 보인다. 본 연구에서 개발된 새로운 모형을 바탕으로 효율적인 결핵환자 관리사업 수행 방안을 제언하면 다음과 같다.
첫째, 국가결핵사업차원에서 현재 진행 중인 공공 민간 협혁체계 추구관리에 새로운 모형을 접목한 결핵감시시스템 개발이 필요로 하다. 세계보건기구(World Health Organization, WHO)는 한 나라의 결핵을 퇴치하기 위해 공공과 민간이 서로 협력하여 환자발견, 치료사업을 전개해 나갈 것을 권고하고 있다[12].
둘째, 개발된 분류 모형을 검사 오더 및 결과, 약제처방 오더 등의 건강보험청구시스템과 연계함으로서 지속적 결핵환자 복약 모니터링 활동을 전개할 수 있을 것으로 판단된다. 결핵을 완치하기 위해서는 많은 숫자의 약제들을 6개월 이상 장기간 복용해야 하므로 결핵환자들의 치료순응도가 낮아 치료도중에 결핵약복용을 중단하기 쉬우며, 이는 내성환자의 증가 원인이 되기도 한다.
최근 고령인구의 증가, 면역저하자의 증가, 빈번한 결핵 집단 발병 등으로 활동성 결핵의 치료만으로는 국내 결핵현황을 개선시키지 못한다는 우려가 제기되고 있고, 결핵의 근절을 목표로 하는 미국과 같은 선진국에서는 잠복결핵대처에 적극적으로 나서고 있다[13]. 이에 본 연구에서 접근한 데이터마이닝 기법을 활용한 새로운 결핵환자 분류 모형은 잠복결핵감시시스템 개발을 위한 중요한 기초자료가 될 것으로 판단된다.
질의응답
핵심어
질문
논문에서 추출한 답변
질환에 대한 감시체계가 필요한 이유는 무엇인가?
질환자를 조기에 발견하여 질환의 확산을 예방하기 위해서는 질환에 대한 감시체계가 필요하다. 질환 감시체계는 실시간으로 질환에 대한 정보를 제공하여, 질병의 발생을 예방하고 질병 확산 시, 신속하게 대응할 수 있도록 돕는 중요한 도구이다.
민간과 공공부문의 협력을 통하여 결핵 신고율을 향상시키기 위한 다양한 정책적 수단이 필요하나 이는 단기간에 해결되기 어려운 난제인 이유는 무엇인가?
우리나라는 OECD 국가 중에서 결핵 발생률 및 유병률이 가장 높은 실정으로 결핵관리사업을 위한 정확한 실태 파악을 위하여 2000년부터 신고체계에 기반을 둔 결핵정보감시체계를 구축하여 운영 중이다[2]. 결핵정보 감시체계의 신뢰성은 의료기관의 신고율(reporting rate)의 영향을 받는데, 2008년도 병의원 신고율은 57.1% 정도 밖에 되지 않는 것으로 나타나 결핵현황을 정확하게 파악하는 데 제한점이 있는 것으로 나타났다[3]. 따라서 민간과 공공부문의 협력을 통하여 결핵 신고율을 향상시키기 위한 다양한 정책적 수단이 필요하나 이는 단기간에 해결되기 어려운 난제이다.
질환 감시체계는 무엇인가?
질환자를 조기에 발견하여 질환의 확산을 예방하기 위해서는 질환에 대한 감시체계가 필요하다. 질환 감시체계는 실시간으로 질환에 대한 정보를 제공하여, 질병의 발생을 예방하고 질병 확산 시, 신속하게 대응할 수 있도록 돕는 중요한 도구이다. 특히나 오늘날 국가 간 경계를 넘어선 질병의 확산 문제는 공공 보건뿐만 아니라 국가 경제에도 위협적인 문제이므로, 세계 각국에서는 질병의 발생을 감지 및 분석하고 이에 신속하게 대응하기 위한 감시체계를 마련할 필요성이 있다[1].
이 논문을 인용한 문헌
저자의 다른 논문 :
활용도 분석정보
상세보기
다운로드
내보내기
활용도 Top5 논문
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다. 더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.