보고서 정보
주관연구기관 |
가톨릭대학교 Catholic University of Korea |
연구책임자 |
이진국
|
참여연구자 |
강나윤
,
김경주
,
박재은
,
이다은
,
이종민
,
허정
,
이상학
,
김세원
,
김인경
,
여창동
,
이혜연
,
조민정
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2022-06 |
과제시작연도 |
2021 |
주관부처 |
보건복지부 [Ministry of Health & Welfare(MW)(MW) |
등록번호 |
TRKO202300004680 |
과제고유번호 |
1465032843 |
사업명 |
의료기기기술개발(R&D) |
DB 구축일자 |
2023-08-09
|
키워드 |
천식.빅데이터.급성 악화.기계 학습.예측 모델.asthma.big data.acute exacerbation.machine learning.prediction model.
|
초록
▼
1. 천식 진료 및 악화 관련 의료 빅데이터 구축
2006년 1년간 건강 보험 가입자 및 의료 급여 수급권자 자격을 유지한 전국민을 기준으로 표본 추출된 100만명의 2002년부터 2015년까지의 데이터를 이용하였음. 본 연구는 환자의 임상적 특성과 매일의 기상, 기후 및 바이러스의 외부 변수를 종합적으로 반영하여 천식 악화 원인 인자를 발굴하고 악화 위험을 예측하는 모델을 만드는 것을 기본 목표로 하기에 기상, 기후 및 바이러스, 미세먼지 정보를 데이터 형태로 구축하여 의료 빅데이터와 결합하였음.
2. 천식 환자 코호트
1. 천식 진료 및 악화 관련 의료 빅데이터 구축
2006년 1년간 건강 보험 가입자 및 의료 급여 수급권자 자격을 유지한 전국민을 기준으로 표본 추출된 100만명의 2002년부터 2015년까지의 데이터를 이용하였음. 본 연구는 환자의 임상적 특성과 매일의 기상, 기후 및 바이러스의 외부 변수를 종합적으로 반영하여 천식 악화 원인 인자를 발굴하고 악화 위험을 예측하는 모델을 만드는 것을 기본 목표로 하기에 기상, 기후 및 바이러스, 미세먼지 정보를 데이터 형태로 구축하여 의료 빅데이터와 결합하였음.
2. 천식 환자 코호트 구축
전국 10개 대학병원에서 전향적인 천식 코호트를 구축함. 2022년 3월까지 전체 175명의 환자를 등록하였음. 등록된 환자를 대상으로 전향적으로 천식과 관련된 정보를 수집함. 해당 환자를 6개월 간격으로 전향적으로 추적관찰 하면서 급성악화를 포함한 다양한 정보를 수집하였음.
3. Machine learning을 이용한 천식 조작적 정의 검증
심평원/공단 자료를 이용한 천식의 조작적 정의를 검증하기 위해 연구를 시행함. 천식 진단을 위한 LGBM 예측 모델 (grid search)은 정확도 85.9%, AUC 91.7%, 민감도 79.0%, 그리고 100%의 특이도를 보였음. 이러한 결과는 로지스틱 회귀와 유사하고 랜덤 포레스트보다 우수하였음. Decision tree model의 정확도는 81.2%였음. 천식 진단을 위한 XGBoost 예측 모델 (Bayesian Hyperparameter Tuning)은 정확도 87.1%, AUC 93.0%, 민감도 82.5%, 특이도 97.9%를 보였음.
4. 급성 악화 원인 도출 및 예측 모델 개발
2008년부터 2013년까지 168,730명의 전체 천식 환자 중에서 1번이라도 급성 악화가 발생된 환자는 10,384명으로 전체 대상자의 6.15% 였음. 빅데이터로 수집된 자료는 156개의 category로 분류되었음. 이 중 tree-based feature selection을 활용하여 variable importance를 기준으로 28개의 변수가 선택됨. 급성 악화 예측에 있어 중요한 설명 변수가 되는 공통된 변수들은 지난해 1년간 급성악화 횟수, 내원일수, 요양일수, 천식 약제 처방 횟수, 동반 질환, 혈압, 총 콜레스테롤, BMI였음. 구축된 model의 성능은 매우 우수 하였음. Group Lasso 방식의 변수 선택법에 의한 model의 경우 환자 매일매일의 개개인별 악화 발생 예측 AUC가 0.7718 이였고, accuracy가 81.92 였음.
5. 빅데이터 연계를 통한 천식 급성악화에 대한 경제성평가
천식환자 중 급성악화가 발생한 군의 첫번째 급성악화만 모아서 보았을 때는 급성악화 발생 이전의 월평균 의료 비용이 12만원을 넘지 않았으나, 급성악화 발생월에는 183,409원 수준까지 상승하게됨. 이후 3개월 시점에서 145,793원 수준으로 다시 비용이 상승했다가, 6개월 이후 시점에도 이후 평균 의료비용 수준인 10만원대로 떨어지지 않고, 12만원대를 유지하는 추세를 보였음. 두번째 이후에 발생한 급성악화의 경우, 기본적으로 급성악화 발생전의 월평균 전반적 의료비용의 수준이 약 12만원~14만원대였음. 급성악화 발생 월의 peak 수준은 첫번째 급성악화보다 약간 낮았으나 거의 유사했음(179,671원). 이후 첫번째 급성악화와 유사하게 3개월차에 한번 더 peak를 보였으나 그 금액 수준이 더 높았고, 첫번째 급성악화보다 더 높은 수준의 전반적 의료비용이 급성악화 발생 이후에 유발됨을 확인할 수 있었음.
6. 보건의료 정책 수립을 위한 가이드라인 제시
전체 천식 환자가 급성악화 1건이 발생하는 것을 예방할 경우 약 1,638억의 비용이 절감되는 것으로 분석되었음.
(출처 : 요약문 5p)
Abstract
▼
1. Establishment of medical big data related to asthma treatment and exacerbation
Data from 2002 to 2015 of 1 million people sampled based on the national population who maintained health insurance subscribers and medical benefit beneficiaries for one year in 2006 were used. The basic goal of thi
1. Establishment of medical big data related to asthma treatment and exacerbation
Data from 2002 to 2015 of 1 million people sampled based on the national population who maintained health insurance subscribers and medical benefit beneficiaries for one year in 2006 were used. The basic goal of this study is to discover factors that cause asthma exacerbation and to predict the risk of exacerbation by comprehensively reflecting the patient's clinical characteristics, daily weather, climate, virus, and the fine dust level.
2. Asthma Patient Cohort Construction
A prospective asthma cohort was established in 10 university hospitals nationwide. By March 2022, a total of 175 patients were enrolled. We prospectively collected asthma-related information from enrolled patients. Various information including acute exacerbation was collected while prospectively following the patient at 6-month intervals.
3. Verification of the operational definition of asthma using machine learning
A study was conducted to verify the operational definition of asthma using the national health insurance data. The LGBM prediction model for asthma diagnosis (grid search) showed 85.9% accuracy, 91.7% AUC, 79.0% sensitivity, and 100% specificity. These results were similar to logistic regression and superior to random forest. The accuracy of the decision tree model was 81.2%. The XGBoost prediction model (Bayesian Hyperparameter Tuning) for asthma diagnosis showed accuracy 87.1%, AUC 93.0%, sensitivity 82.5%, and specificity 97.9%.
4. Examination of causes of acute exacerbation and development of predictive models
From 2008 to 2013, among 168,730 asthma patients, 10,384 patients had an acute exacerbation at least once, accounting for 6.15% of all subjects. The collected big data was classified into 156 categories. Among them, 28 variables were selected based on variable importance using tree-based feature selection. Important variables associated with acute exacerbation were the number of acute exacerbations, the number of visits, the number of days of care, the number of prescribed asthma medications, comorbidities, blood pressure, total cholesterol, and BMI over the past year. The performance of the model was very good. In the case of the group Lasso method of variable selection method, the AUC for predicting the occurrence of exacerbation for each patient every day was 0.7718, and the accuracy was 81.92.
5. Economic evaluation of acute exacerbation of asthma through big data linkage
When looking at only the first acute exacerbation in the acute exacerbation group among asthma patients, the average monthly medical cost before the acute exacerbation did not exceed 120,000 won. The cost rose again and even after 6 months, it did not fall to the average medical cost level of 100,000 won and maintained a trend of maintaining the 120,000 won level. In the case of acute exacerbations that occurred after the second acute exacerbation, the average monthly overall medical cost before the acute exacerbation was about 120,000 to 140,000 won. However, the peak level in the month of the acute exacerbation was slightly lower than that of the first acute exacerbation, but almost similar (179,671 won). After that, similar to the first acute exacerbation, it peaked once again at 3 months, but the amount was higher. It was confirmed that the overall medical cost higher than the first acute exacerbation was induced after the acute exacerbation occurred.
6. Guidelines for establishing health and medical policies
It was analyzed that if all asthma patients were prevented from having one acute exacerbation, about 163.8 billion won in cost would be saved.
(source: SUMMARY 6)
목차 Contents
- 표지 ... 1
- 제출문 ... 2
- 보고서 요약서 ... 3
- 요약문 ... 5
- SUMMARY ... 6
- 6.1 총괄연구개발과제의 연구성과 실적 및 향후 계획 ... 7
- 6.2 연구성과 유형별 세부 내역 ... 9
- 7. 참여연구원 현황표 ... 10
- 목차 ... 11
- 1. 연구개발과제의 개요 ... 12
- 1-1. 연구개발 목적 ... 12
- 1-2. 연구개발의 필요성 ... 12
- 1-3. 연구개발 범위 ... 12
- 2. 연구개발과제의 수행 과정 및 수행 내용 ... 13
- 1장. 천식 악화 인자 발굴을 위한 빅데이터 구축 ... 13
- 1절. 천식 진료 및 악화 관련 의료 빅데이터 구축 ... 13
- 2절. 질병 관리청 감염병 바이러스 정보 구축 ... 14
- 3절. 기상·기후 및 미세먼지 자료 구축 ... 17
- 2장. 진료현황을 통한 조작적 정의 검증 ... 22
- 1절. 천식 코호트 구축 ... 22
- 2절. 천식 환자의 진료 현황 ... 22
- 3절. 조작적 정의 검증 ... 24
- 3장. 급성 악화 원인 도출 및 예측 모델 개발 ... 26
- 1절. 급성 악화 원인 인자 규명을 위한 모집단 설정 ... 26
- 2절. 급성 악화 원인 인자 규명을 위한 분석 자료 생성_표본 코호트 ... 27
- 3절. 급성 악화 원인 인자 규명을 위한 분석 자료 생성_연계 데이터 ... 33
- 4절. 급성 악화 원인 인자 규명 및 예측 모델링을 위한 분석 방법 ... 39
- 5절. 빅데이터를 통한 질환 악화 예측 모델 구축 ... 44
- 4장. 임상 정보 수집 및 급성 악화 예측 모델의 임상 적용 ... 51
- 1절. 임상정보 수집 ... 51
- 2절. 빅데이터 연계를 통한 질환 악화 예측 모델 평가 ... 55
- 5장. 빅테이터 연계를 통한 천식 급성악화에 대한 경제성평가 ... 56
- 1절. 경제성 평가 시행 및 검증 ... 56
- 2절. 보건의료 정책 수립을 위한 가이드라인 제시 ... 69
- 3. 연구개발과제의 수행 결과 및 목표 달성 정도 ... 71
- 4. 목표 미달 시 원인분석 ... 77
- 5. 연구개발성과의 관련 분야에 대한 기여 정도 ... 80
- 6. 연구개발성과의 관리 및 활용 계획 ... 81
- 별첨 자료 ... 82
- 끝페이지 ... 294
※ AI-Helper는 부적절한 답변을 할 수 있습니다.