우리나라 노인장기요양보험에서는 수급자와 그 가족부양자가 수급자의 심신기능 상태와 욕구에 따라 불이익이나 불편함이 없이 비용-효과적으로 장기요양 급여를 이용할 수 있도록 지원하고자 이용지원 상담을 제공하고 있다. 본 연구는 재가급여 이용자의 이용지원 정기상담 대상자 선정시 상담 대상자의 욕구를 반영하지 않아 이용지원 상담의 만족도와 효율성이 낮은 문제를 통계학적 모형을 활용하여 해결하고자 수행되었다. 모형 개발을 위해 2013년 3월 장기요양 재가급여를 이용한 수급자와 가족부양자를 대상으로 이용지원 상담에 대한 욕구와 관련 변수를 조사하였으며, 2,000명이 조사를 완료하였다. 조사 자료를 바탕으로 이용지원 상담 대상자 선정모형을 다양한 데이터마이닝 기법(로지스틱 회귀모형, 의사결정 나무모형, Lasso 모형, 자동 신경망모형, 그래디언트 부스팅, 앙상블 모형)을 통해 개발하였고, 이중 가장 안정적이고 현장 적용이 쉽고 성능이 좋은 Lasso 모형 결과를 최종모형으로 선정하였다. 본 연구가 이용지원 상담의 만족도를 높이고 업무를 효율화 하는데 기여할 것으로 기대된다.
우리나라 노인장기요양보험에서는 수급자와 그 가족부양자가 수급자의 심신기능 상태와 욕구에 따라 불이익이나 불편함이 없이 비용-효과적으로 장기요양 급여를 이용할 수 있도록 지원하고자 이용지원 상담을 제공하고 있다. 본 연구는 재가급여 이용자의 이용지원 정기상담 대상자 선정시 상담 대상자의 욕구를 반영하지 않아 이용지원 상담의 만족도와 효율성이 낮은 문제를 통계학적 모형을 활용하여 해결하고자 수행되었다. 모형 개발을 위해 2013년 3월 장기요양 재가급여를 이용한 수급자와 가족부양자를 대상으로 이용지원 상담에 대한 욕구와 관련 변수를 조사하였으며, 2,000명이 조사를 완료하였다. 조사 자료를 바탕으로 이용지원 상담 대상자 선정모형을 다양한 데이터마이닝 기법(로지스틱 회귀모형, 의사결정 나무모형, Lasso 모형, 자동 신경망모형, 그래디언트 부스팅, 앙상블 모형)을 통해 개발하였고, 이중 가장 안정적이고 현장 적용이 쉽고 성능이 좋은 Lasso 모형 결과를 최종모형으로 선정하였다. 본 연구가 이용지원 상담의 만족도를 높이고 업무를 효율화 하는데 기여할 것으로 기대된다.
In the long-term care insurance (LTCI) system, National Health Insurance Service (NHIS) provide counseling services for beneficiaries and their family caregivers, which help them use LTC services appropriately. The purpose of this study was to develop a Target Selection Model for the Counseling Serv...
In the long-term care insurance (LTCI) system, National Health Insurance Service (NHIS) provide counseling services for beneficiaries and their family caregivers, which help them use LTC services appropriately. The purpose of this study was to develop a Target Selection Model for the Counseling Services based on needs of beneficiaries and their family caregivers. To develope models, we used data set of total 2,000 beneficiaries and family caregivers who have used the long-term care services in their home in March 2013 and completed questionnaires. The Target Selection Model was established through various data-mining models such as logistic regression, gradient boosting, Lasso, decision-tree model, Ensemble, and Neural network. Lasso model was selected as the final model because of the stability, high performance and availability. Our results might improve the satisfaction and the efficiency for the NHIS counseling services.
In the long-term care insurance (LTCI) system, National Health Insurance Service (NHIS) provide counseling services for beneficiaries and their family caregivers, which help them use LTC services appropriately. The purpose of this study was to develop a Target Selection Model for the Counseling Services based on needs of beneficiaries and their family caregivers. To develope models, we used data set of total 2,000 beneficiaries and family caregivers who have used the long-term care services in their home in March 2013 and completed questionnaires. The Target Selection Model was established through various data-mining models such as logistic regression, gradient boosting, Lasso, decision-tree model, Ensemble, and Neural network. Lasso model was selected as the final model because of the stability, high performance and availability. Our results might improve the satisfaction and the efficiency for the NHIS counseling services.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구는 통계적 모형을 적용하여 이용지원 상담 요구가 있는 대상자를 선정함으로써 이용지원 상담 대상자 선정 시 대상자 욕구 미반영에 따른 문제점을 해결하고 이용지원 상담의 효과를 높이고자 수행되었다. 본 연구는 이용지원 상담 대상자 선정모형으로 ‘가족지지체계가 있는 수급자모형’과 ‘가족지지체계가 없는 수급자모형’을 제안하였다.
이에 본 연구는 재가급여 수급자와 가족부양자의 이용지원 상담에 대한 욕구조사 자료를 활용하여 이용 지원 상담을 원하는 자의 영향요인을 파악하고, 이를 근거로 이용지원 상담 대상자를 선정하는 모델을 개발하고자 하였다.
제안 방법
변수의 중요도를 산출할 수 있는 로지스틱 회귀모형, 그래디언트 부스팅, Lasso 모형, 나무모형을 통해 ‘가족지지체계가 있는 수급자 모형’의 중요 변수를 살펴보았다. 그래디언트 부스팅은 변수 중요도가 높은 변수 상위 10개, Lasso 모형은 최종 모형에서 남은 변수를, 그리고 나무모형에서는 변수 중요도가 높은 변수를 요약하여 정리하였다 (Table 3.2). 로지스틱 회귀모형은 총 15개의 변수를 모형의 중요 변수로 선택하였다.
부양부담감 변수는 6개 부양부담 영역별 항목의 점수를 합하여 영역별로 점수를 구하고 점수의 분포에 따라 부양부담 정도를 이산형 변수로 변환하여 활용하였다. 노인과 부양자 관계의 부정적 변화와 사회적 활동 제한에 대해서는 제 1사분위수(25%)와 제 3사분위수(75%)를 기준으로 3개 항목으로 구분하였고, 가족 관계의 부정적 변화, 심리적 부담감, 재정 및 경제활동 상의 부담감, 건강상의 부담감에 대해서는 중위수(50%)를 기준으로 2개 항목으로 구분하여 활용하였다.
독립변수는 크게 수급자 특성, 가족부양자 특성, 재가급여이용 관련 특성으로 나누었다. 첫째, 수급자 특성은 인구사회학적 특성(성, 연령, 장기요양등급, 자격, 학력, 지역), 건강 및 기능상태, 질병 및 증상이며, 건강 및 기능상태와 질병 및 증상에 대한 정보는 노인장기요양보험 등급판정시 수집되는 ‘장가요양인정조사표’를 활용하였다.
전술한 5개의 모형의 결과를 다수결로 결합한 앙상블 모형을 구축하였다. 또한 적합된 나무모형에 일반화하기에 무리가 있는 분지가 있어 대체 규칙(surrograte rule)으로 변형한 나무모형도 함께 구축하였다.
Lasso 모형은 이용지원 상담에 대한 인지도와 신체기능 영역의 체위변경하기를 중요 변수로 선정하였다. 마지막으로 나무모형은 다른 모형과 마찬가지로 신체기능 변수를 중요 변수로 선정하였고, 이와 더불어 급여 이용시 표준이용계획서 참고여부, 이용지원 상담 인지도를 중요 변수로 선정하였다.
변수의 중요도를 산출할 수 있는 로지스틱 회귀모형, 그래디언트 부스팅, Lasso 모형, 나무모형을 통해 ‘가족지지체계가 있는 수급자 모형’의 중요 변수를 살펴보았다.
‘장기요양인정조사표’는 노인장기요양보험 도입 당시에 개발된 것으로 신체기능, 수단적일상생활기능, 인지기능, 행동변화, 간호처치, 재활, 복지용구, 지원 형태, 환경평가, 시력·청력상태, 질병 및 증상 등으로 구성된다. 본 상담욕구모형 개발을 위해서는 인정 조사표 항목 중 신체기능 13항목, 수단적일상생활기능 10항목, 인지기능 10항목, 행동변화 22항목, 간호처치 10개 항목, 재활 10개 항목, 시력상태, 청력상태를 활용하였다. 이와 더불어 대상자의 중증도 측정 변수로 활용 (Hyun과 Lee, 2012; Lee 등, 2013)되는 신체기능, 인지기능, 행동변화, 간호처치, 재활 5개 영역에 대해서는 영역별 점수(영역별 문항의 점수 합)를 추가로 활용하였다 (Table 2.
본 연구 수행을 위해 2013년 3월 장기요양 재가급여(방문요양, 방문목욕, 방문간호, 주야간보호, 단기 보호)를 이용한 수급자 가운데, 2013년 1월부터 3월 사이에 장기요양 등급을 신규 또는 갱신판정 받은 자를 대상으로 이용지원 상담에 대한 욕구를 조사하였다. 조사 모집단은 2013년 3월 장기요양 재가급여 수급자 163,322명 중에서 2013년 1월부터 3월 사이에 신규 및 갱신판정을 받은 수급자 25,862명으로, 거주지역(서울, 경기, 강원, 충청, 전라, 경상), 장기요양등급(1, 2, 3등급), 의료보장형태(일반, 그 외(의료급여, 기초생활수급, 경감)), 재가급여 종류(방문요양, 그 외)를 층화변수로 하여 층화비례확률 추출방법을 통해 조사 표본을 추출하였다.
본 연구는 이용지원 상담 대상자 선정모형으로 ‘가족지지체계가 있는 수급자모형’과 ‘가족지지체계가 없는 수급자모형’을 제안하였다.
본 연구의 종속변수는 이용지원 상담에 대한 욕구가 있는 지 여부로 정하였다. 이에 “장기요양서비스 이용시 불편하거나 어려운 점을 해결하고 원활한 급여이용 지원을 위해 공단 직원이 제공하는 상담이 필요하다고 생각하십니까?”라는 질문에 ‘예’라고 응답한 자를 상담에 대한 욕구가 있는 대상자로 정의하였다.
장기요양급여 외의 다른 서비스 이용 여부는 노인장기요양보험의 재가급여 이외에 별도로 이용하고 있는 서비스가 있는지에 대한 변수이고, 급여이용 시 불편사항 변수는 불편사항이 없다고 응답한 경우와 그렇지 않은 경우 2가지로 구분하였다. 본인부담금 부담정도는 본인부담금을 납부하지 않는 기초생활수급자와 부담됨(매우 부담된다, 부담된다), 적당함, 부담되지 않음(부담되지 않는다, 전혀 부담되지 않는다)로 구분하였다.
‘매우 그렇다’라고 응답할수록 부양부담을 많이 느끼는 것으로 판단한다. 부양부담감 변수는 6개 부양부담 영역별 항목의 점수를 합하여 영역별로 점수를 구하고 점수의 분포에 따라 부양부담 정도를 이산형 변수로 변환하여 활용하였다. 노인과 부양자 관계의 부정적 변화와 사회적 활동 제한에 대해서는 제 1사분위수(25%)와 제 3사분위수(75%)를 기준으로 3개 항목으로 구분하였고, 가족 관계의 부정적 변화, 심리적 부담감, 재정 및 경제활동 상의 부담감, 건강상의 부담감에 대해서는 중위수(50%)를 기준으로 2개 항목으로 구분하여 활용하였다.
이용지원 상담 대상자 선정모형은 ‘가족지지체계가 있는 수급자 모형’과 ‘가족지지 체계가 없는 수급자 모형’으로 구분하여 개발하였다.
이용지원 상담 대상자 선정모형을 개발하기 위해 로지스틱 회귀모형, 의사결정 나무모형, Lasso 모형, 자동 신경망모형(auto neural network), 그래디언트 부스팅(gradient boosting), 그리고 고려한 각종 모형의 결과를 다수결로 결합하는 앙상블 모형을 사용하였고, 대화식 방법으로 가지를 조정한 의사결정 나무모형을 구축하였다. 모형 개발에는 SAS Enterprise Miner 13.
장기요양급여 만족도는 불만족(매우 불만족, 불만족), 보통, 만족(매우 만족, 만족) 3단계로 측정했으며, 표준이용계획서 참고여부는 공단이 제공하는 표준이용계획서를 알고 있고 재가급여 결정 시 표준이용계획서를 참고하는 경우 ‘인지하고 참고’, 표준이용계획서를 알고 있으나 서비스 결정시 참고하지 않는다면 ‘인지하지만 미참고’, 표준이용계획서를 인지하지 못하는 경우 ‘모름’으로 구분하였다.
약한 분류기법의 성능을 강화시키는 그래디언트 부스팅에서는 개별 모형으로 깊이가 2인 이진 나무를 사용하였다. 전술한 5개의 모형의 결과를 다수결로 결합한 앙상블 모형을 구축하였다. 또한 적합된 나무모형에 일반화하기에 무리가 있는 분지가 있어 대체 규칙(surrograte rule)으로 변형한 나무모형도 함께 구축하였다.
본 연구 수행을 위해 2013년 3월 장기요양 재가급여(방문요양, 방문목욕, 방문간호, 주야간보호, 단기 보호)를 이용한 수급자 가운데, 2013년 1월부터 3월 사이에 장기요양 등급을 신규 또는 갱신판정 받은 자를 대상으로 이용지원 상담에 대한 욕구를 조사하였다. 조사 모집단은 2013년 3월 장기요양 재가급여 수급자 163,322명 중에서 2013년 1월부터 3월 사이에 신규 및 갱신판정을 받은 수급자 25,862명으로, 거주지역(서울, 경기, 강원, 충청, 전라, 경상), 장기요양등급(1, 2, 3등급), 의료보장형태(일반, 그 외(의료급여, 기초생활수급, 경감)), 재가급여 종류(방문요양, 그 외)를 층화변수로 하여 층화비례확률 추출방법을 통해 조사 표본을 추출하였다. 조사는 객관성 및 전문성을 확보하기 위해 조사전문기관을 통해 진행하였으며, 연구진이 제공한 구조화된 설문지를 바탕으로 조사원이 대상자의 가정 또는 면접장소를 방문하여 1 : 1 개별면접방식으로 이루어졌다.
조사 모집단은 2013년 3월 장기요양 재가급여 수급자 163,322명 중에서 2013년 1월부터 3월 사이에 신규 및 갱신판정을 받은 수급자 25,862명으로, 거주지역(서울, 경기, 강원, 충청, 전라, 경상), 장기요양등급(1, 2, 3등급), 의료보장형태(일반, 그 외(의료급여, 기초생활수급, 경감)), 재가급여 종류(방문요양, 그 외)를 층화변수로 하여 층화비례확률 추출방법을 통해 조사 표본을 추출하였다. 조사는 객관성 및 전문성을 확보하기 위해 조사전문기관을 통해 진행하였으며, 연구진이 제공한 구조화된 설문지를 바탕으로 조사원이 대상자의 가정 또는 면접장소를 방문하여 1 : 1 개별면접방식으로 이루어졌다. 자료수집은 2013년 7월 4일부터 7월 24일까지 전문 조사업체 ㈜한국능률협회컨설팅을 통해 실시되었다.
1). 질병 및 증상에 대해서는 인정조사 시 3개월간 앓고 있는 만성질환에 대해 조사하는 항목을 활용하였고, 치매, 중풍(뇌졸중), 혈압, 당뇨, 관절염, 요통, 골다공증, 골절, 암이 활용되었다.
첫째, 수급자 특성은 인구사회학적 특성(성, 연령, 장기요양등급, 자격, 학력, 지역), 건강 및 기능상태, 질병 및 증상이며, 건강 및 기능상태와 질병 및 증상에 대한 정보는 노인장기요양보험 등급판정시 수집되는 ‘장가요양인정조사표’를 활용하였다.
대상 데이터
‘가족지지체계가 없는 수급자 모형’의 주 상담대상자는 가족부양자가 없는 독거노인으로, 실제 상담에 대한 욕구가 있는 수급자를 선정하기 위한 모형이다. 모형 개발을 위해서 수급자가 응답한 173명의 데이터를 활용하였고, 독립변수로 수급자 특성, 재가급여이용 관련 특성을 사용하였다.
‘가족지지체계가 있는 수급자 모형’은 주 상담대상자가 가족부양자로, 이용지원 상담에 대한 욕구가 있는 가족을 선정하기 위한 모형이다. 모형개발을 위해 가족부양자가 응답한 1,827명의 데이터를 활용하였고, 독립변수로 수급자 특성, 가족부양자 특성, 재가급여 이용관련 특성을 사용하였다. ‘가족지지체계가 없는 수급자 모형’의 주 상담대상자는 가족부양자가 없는 독거노인으로, 실제 상담에 대한 욕구가 있는 수급자를 선정하기 위한 모형이다.
조사에 대한 응답은 장기요양 수급자 대부분이 와상 또는 준와상, 치매질환자임을 고려하여, 이용지원 상담의 대상이 되는 수급자 및 가족부양자 모두가 가능하도록 하였다. 응답자 2,000명 중 173명이 가족부양자가 없는 독거 수급자가 응답하였고, 나머지 1,827명은 가족부양자가 응답하였다.
조사는 객관성 및 전문성을 확보하기 위해 조사전문기관을 통해 진행하였으며, 연구진이 제공한 구조화된 설문지를 바탕으로 조사원이 대상자의 가정 또는 면접장소를 방문하여 1 : 1 개별면접방식으로 이루어졌다. 자료수집은 2013년 7월 4일부터 7월 24일까지 전문 조사업체 ㈜한국능률협회컨설팅을 통해 실시되었다. 조사 목표대상자는 2,000명(신뢰수준 95%, 표준오차의 한계 ±2.
조사 목표대상자는 2,000명(신뢰수준 95%, 표준오차의 한계 ±2.19% 포인트)으로 정하였고, 최종적으로 2,000명이 조사 완료되었다.
데이터처리
Lasso 모형은 이용지원 상담에 대한 욕구가 있는 대상자를 선정하는 중요 변수로 ‘이용지원 상담 인지도’, ‘재가급여이용시 어려움 여부’, ‘급여이용시 표준이용계획서 참고 여부’와 수급자의 신체기능 상태 중 ‘체위변경하기’를 채택하였다. 본 연구에서 제안한 Lasso 모형에서 중요 변수로 채택한 변수를 통해 분석 대상자 2,000명의 상담대상자를 추정하였고, 이 결과를 현행 상담기준에 따른 상담군 결과와 비교하였다 (Table 4.1). 전체 2,000명 중 재가급여에서 시설급여로 변환(8.
이론/모형
1에서 제공하는 다양한 분류모형을 적용하였다 (SAS Institute, 2014). 가장 기본적인 방법인 로지스틱 회귀모형에서는 독립변수가 많기 때문에 후방제거법(제거 유의수준 0.05)으로 변수를 선택하였다. 나무모형은 Gini계수를 이용한 이진 분류나무를 적용하였다.
05)으로 변수를 선택하였다. 나무모형은 Gini계수를 이용한 이진 분류나무를 적용하였다. 축소방법(shrinkage method)의 하나로 자연스럽게 변수선택이 되는 Lasso 모형에서는 SBC(Schwarz Bayesian Crterion) 기준으로 최적 모형을 선택하였으며, 신경망 모형으로는 Multi-Layer Perceptron 방법을 적용하였다.
따라서 ‘가족지지체계가 없는 수급자모형’의 최종 모형으로 데이터 수가 변수의 수에 비해 상대적으로 적은 고차원 데이터상황에서 가장 간결하고 안정적인 성능을 보인 Lasso 모형을 선택하였다.
이용지원 상담 대상자 선정모형을 개발하기 위해 로지스틱 회귀모형, 의사결정 나무모형, Lasso 모형, 자동 신경망모형(auto neural network), 그래디언트 부스팅(gradient boosting), 그리고 고려한 각종 모형의 결과를 다수결로 결합하는 앙상블 모형을 사용하였고, 대화식 방법으로 가지를 조정한 의사결정 나무모형을 구축하였다. 모형 개발에는 SAS Enterprise Miner 13.1에서 제공하는 다양한 분류모형을 적용하였다 (SAS Institute, 2014). 가장 기본적인 방법인 로지스틱 회귀모형에서는 독립변수가 많기 때문에 후방제거법(제거 유의수준 0.
‘가족지지체계가 없는 수급자 모형’은 독립변수는 많지만 대상자가 173명으로 적어 분석용 70%, 검증용 30%로 분할하였다. 모형의 성능을 비교하기 위하여 오분류율(misclassification rate), ROC 곡선의 면적인 AUC(Area Under Curve)를 이용하였다.
가족부양자의 인구사회학적 특성은 성, 연령, 학력, 결혼상태, 신체적 수발기간, 주관적 건강상태, 직업, 월평균 소득, 수급자와의 관계, 가족요양보사여부, 경제활동여부이다. 부양부담감은 가족부양자가 수급자를 부양하면서 느낄 수 있는 부담감으로 Kwon (1994)의 부양부담감 측정도구를 활용하여 조사하였다 (Table 2.2). 부양부담감 측정도구는 노인과 주부양자 관계의 부정적 변화, 사회적 활동제한, 가족관계의 부정적 변화, 심리적 부담감, 재정 및 경제활동상의 부담감, 건강상의 부담감인 6개 영역으로 구성되며, 총 28개 항목에 대해 5점 척도로 측정된다.
이에 Lasso 모형의 결과를 ‘가족지지체계가 있는 수급자 모형’의 최종 모형으로 선정하였다.
본 상담욕구모형 개발을 위해서는 인정 조사표 항목 중 신체기능 13항목, 수단적일상생활기능 10항목, 인지기능 10항목, 행동변화 22항목, 간호처치 10개 항목, 재활 10개 항목, 시력상태, 청력상태를 활용하였다. 이와 더불어 대상자의 중증도 측정 변수로 활용 (Hyun과 Lee, 2012; Lee 등, 2013)되는 신체기능, 인지기능, 행동변화, 간호처치, 재활 5개 영역에 대해서는 영역별 점수(영역별 문항의 점수 합)를 추가로 활용하였다 (Table 2.1). 질병 및 증상에 대해서는 인정조사 시 3개월간 앓고 있는 만성질환에 대해 조사하는 항목을 활용하였고, 치매, 중풍(뇌졸중), 혈압, 당뇨, 관절염, 요통, 골다공증, 골절, 암이 활용되었다.
나무모형은 Gini계수를 이용한 이진 분류나무를 적용하였다. 축소방법(shrinkage method)의 하나로 자연스럽게 변수선택이 되는 Lasso 모형에서는 SBC(Schwarz Bayesian Crterion) 기준으로 최적 모형을 선택하였으며, 신경망 모형으로는 Multi-Layer Perceptron 방법을 적용하였다. 약한 분류기법의 성능을 강화시키는 그래디언트 부스팅에서는 개별 모형으로 깊이가 2인 이진 나무를 사용하였다.
성능/효과
96%로 가장 높은 성능을 보였고, 다음으로 그래디언트 부스팅, 나무모형 순으로 나타났다. AUC 기준으로는 그래디언트 부스팅, Lasso 모형, 나무모형 순으로 성능이 좋게 나타났다 (Table 3.3).
91%로 가장 높은 성능을 보였고, 다음으로 그래디언트 부스팅, Lasso 순으로 나타났다. AUC기준으로는 그래디언트 부스팅, 앙상블모형, 신경망모형, Lasso 모형, 나무모형 순으로 우수한 것으로 나타났다 (Table 3.1). 그러나 그래디언트 부스팅, 앙상블모형, 신경망모형은 예측력은 좋은 반면 로지스틱 회귀모형이나 나무모형과 같이 예측 결과를 쉽게 이해할 수 없다는 단점이 있다.
41%로 우수한 편이었지만, 평가용과 검증용 데이터에서 로지스틱 회귀모형에 비해 낮은 성능을 보였다. 로지스틱 회귀모형, 그래디언트 부스팅이나 Lasso 모형 간의 오분류율 차이는 1.09%p로 그렇게 크지 않았고, 나무모형과는 2.36%p 정도의 차이를 보였다.
4와 같다. 로지스틱 회귀모형은 총 11개의 변수를 모형의 중요 변수로 선택하였고, 수급자의 건강 및 기능상태 변수가 주를 이루었으며, 주로 신체기능 및 수단적 일상생활 기능 변수였다. 그래디언트 부스팅은 로지스틱 회귀모형과 달리 주로 이용지원 상담에 대한 인지도, 급여이용시 표준이용계획서 참고여부, 재가급여 이용시 어려움 여부 등을 중요 변수로 선택하였다.
셋째, 재가급여이용 관련 특성 변수는 이용급여유형, 급여이용 기간, 장기요양급여 만족도, 표준이용계획서 참고여부, 장기요양 급여 외의 다른 서비스 이용 여부, 급여 이용 시 불편한 점, 본인부담금 부담 정도이다. 이용급여유형은 방문요양만을 이용하는 경우, 방문요양과 방문목욕을 함께 이용하는 경우, 그 외의 급여를 이용하는 경우는 기타로 정의하였고, 급여이용기간은 방문요양, 방문목욕, 방문간호, 주야간보호, 단기보호 5가지 급여이용 기간 중 가장 긴 기간을 사용하였다.
연구결과, 재가급여 수급자 중 가족부양자가 있어 주 상담대상인 상담욕구가 있는 가족부양자를 선정하는 모형인 ‘가족지지체계가 있는 수급자 모형’의 경우 분석에 활용된 모형 중 15개의 변수로 수정된 로지스틱 회귀모형의 성능이 가장 우수하였으나, 모형의 간결성을 고려하면 Lasso 모형이 단 3개의 변수로 로지스틱 회귀모형에 가까운 성능을 보였다.
4%)하여 현행 재가급여 상담군에서 제외된 자를 제외한 1,746명에 대해 다음 회귀에 진행될 상담군이 할당되었다. 이 1,746명을 Lasso 모형에 적용한 결과, 50.6%가 상담필요 대상자로 선정되었고 49.4%가 상담불필요군, 즉, 요구가 없는 자로 선정되었다. 현행 상담군별 Lasso 모형의 추정 결과를 비교해 보면, 각 군의 절반가량이 상담불필요 군으로 선정되었다.
1). 전체 2,000명 중 재가급여에서 시설급여로 변환(8.3%)하거나 급여를 미이용(4.4%)하여 현행 재가급여 상담군에서 제외된 자를 제외한 1,746명에 대해 다음 회귀에 진행될 상담군이 할당되었다. 이 1,746명을 Lasso 모형에 적용한 결과, 50.
한편, 부양가족이 없는 재가 수급자 중 이용지원 상담 욕구가 있는 대상자를 선정하는 모형인 ‘가족지지체계가 없는 수급자모형’은 신경망모형이 분석용 데이터에서 최고의 성능을 보였으나 검증용 데이터에서 낮은 성능을 보여 과적합되었고, 5개 모형의 결과를 결합한 앙상블 모형 또한 과적합의 양상을 보였다.
후속연구
이는 모든 재가급여 수급자와 가족부양자가 현행 상담선정기준에 따라 이용지원 상담 대상자로 선정되어 주기적으로 상담을 제공받지만 대상자의 절반가량이 공단의 상담을 불필요하다고 느낀다고 해석할 수 있다. 따라서 향후 이용지원 상담 대상자 선정 시 Lasso 모형에서 채택한 변수를 인정조사표 또는 상담기록표에 포함하여 상담 필요도가 있는 대상자를 파악하고 상담을 제공한다면, 기존 상담대상자 선정이 공단의 일방향적 판단에 의해 이루어져 이용지원 상담에 대한 효율성과 만족도가 낮았던 부분을 해소할 수 있을 것으로 기대된다.
질의응답
핵심어
질문
논문에서 추출한 답변
현행 상담군별 Lasso 모형의 추정 결과, 각 군의 절반가량이 상담불필요 군으로 선정되었는데, 어떻게 해석할 수 있는가?
현행 상담군별 Lasso 모형의 추정 결과를 비교해 보면, 각 군의 절반가량이 상담불필요 군으로 선정되었다. 이는 모든 재가급여 수급자와 가족부양자가 현행 상담선정기준에 따라 이용지원 상담 대상자로 선정되어 주기적으로 상담을 제공받지만 대상자의 절반가량이 공단의 상담을 불필요하다고 느낀다고 해석할 수 있다. 따라서 향후 이용지원 상담 대상자 선정 시 Lasso 모형에서 채택한 변수를 인정조사표 또는 상담기록표에 포함하여 상담 필요도가 있는 대상자를 파악하고 상담을 제공한다면, 기존 상담대상자 선정이 공단의 일방향적 판단에 의해 이루어져 이용지원 상담에 대한 효율성과 만족도가 낮았던 부분을 해소할 수 있을 것으로 기대된다.
우리나라 노인장기요양보험이 제공하는 것은?
우리나라 노인장기요양보험에서는 수급자와 그 가족부양자가 수급자의 심신기능 상태와 욕구에 따라 불이익이나 불편함이 없이 비용-효과적으로 장기요양 급여를 이용할 수 있도록 지원하고자 이용지원 상담을 제공하고 있다. 본 연구는 재가급여 이용자의 이용지원 정기상담 대상자 선정시 상담 대상자의 욕구를 반영하지 않아 이용지원 상담의 만족도와 효율성이 낮은 문제를 통계학적 모형을 활용하여 해결하고자 수행되었다.
데이터마이닝 기법에는 어떤 것이 있는가?
모형 개발을 위해 2013년 3월 장기요양 재가급여를 이용한 수급자와 가족부양자를 대상으로 이용지원 상담에 대한 욕구와 관련 변수를 조사하였으며, 2,000명이 조사를 완료하였다. 조사 자료를 바탕으로 이용지원 상담 대상자 선정모형을 다양한 데이터마이닝 기법(로지스틱 회귀모형, 의사결정 나무모형, Lasso 모형, 자동 신경망모형, 그래디언트 부스팅, 앙상블 모형)을 통해 개발하였고, 이중 가장 안정적이고 현장 적용이 쉽고 성능이 좋은 Lasso 모형 결과를 최종모형으로 선정하였다. 본 연구가 이용지원 상담의 만족도를 높이고 업무를 효율화 하는데 기여할 것으로 기대된다.
참고문헌 (15)
Han, E. J., Kwon, J. H., Lee, J. M., Lee, J. S., Choi, J. K., Park, J. D. (2013). Improvement of LTC Service Counseling System for the Community-Dwelling Elderly, National Health Insurance Service, Seoul.
Han, E. J., Lee, J. M., Jo, J. W. and Kim, D. H. (2012). Improvement of LTC Service Management System, National Health Insurance Service, Seoul.
Han, E. J., Lee, J. S., Kim, D. G. and Kwon, J. H. (2014). A decision-support system for care plan in Long-term care insurance, The Korean Journal of Applied Statistics, 27, 667-679.
Hastie, T., Tibshirani, R. and Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference and Prediction, Second Ed, Springer Verlag, New York.
Hyun, K. R. and Lee, S. M. (2012). Effects on the functional status changes of LTC(Long-Term-Care) services, Journal of the Korean Gerontological Society, 32, 593-609.
Jegal, H. S. (2011). Improvement of Long-term care insurance service quality: development of integrated community system for the elderly health and welfare and introduce necessary of care management, Public policy institute for people, Seoul.
Kang, H. C., Han, S. T., Choi, J. H., Lee, S. G. and Kim, E. S. (2014). Data Mining Methodology for Big Data Analysis, Freedom Academy, Seoul.
Kwon, J. D. (1994). A study on the assessment of caregiver burden in caring for the demented elderly in Korea, Doctoral thesis of Yonsei university, Seoul.
Lee, Y. K., Jung, K. H., Kim, J. S., Kim, C. W., Park, G. W., Jung, M. Y., Kim, S. J. and Nam, H. J. (2013). Reform LTC Level-Decision system and development of dementia management model, National Health Insurance Service Korea Institute for Health and Social Affairs, Seoul.
National Health Insurance Service (2014a). Act on Long-Term Care Insurance for Senior Citizens, National Health Insurance Service, Seoul.
National Health Insurance Service (2014b). A Source Book for the Work Processing of Long-Term Care Insurance, National Health Insurance Service, Seoul.
OECD (2011). Help Wanted?, Providing and paying for long-term care.
SAS Institute Inc (2014). SAS Enterprise Miner 13.1 Reference Help. Cary, NC.
Sunwoo, D., Lee, T. H., Seo, D. M., Chung, S. D. and Kim, S. J. (2014). Improvement for Advanced Long-Term Care Insurance System, National Health Insurance Service, Seoul.
Tibshirani, R. (1996). Regression shrinkage and selection via the Lasso, Journal of the Royal Statistical Society, Series B, 58, 267-288.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.