의료정보의 급속한 발달로 인하여 막대한 의료 빅데이터 정보가 축적되고 있다. 이러한 의료 빅데이터는 고령화와 의료비의 가파른 상승을 해결하는데 중요한 자료로 활용될 가능성이 큰 분야이다. 특히 한국의 경우 전 국민대상 주민등록번호와 전산화된 이용 자료들을 기반으로 빅데이터를 활용할 수 있는 의료 인프라 측면에서는 다른 국가에 비해 우위를 점할 수 있다. 본 연구에서는 국민건강보험공단 빅데이터 자료와 통계청 사망자 데이터를 활용하여 강원도의 사망자 분석 및 사망률에 영향을 미치는 요인을 분석하기 위해 상관분석을 수행한 후 시사점을 도출하였다. 분석 결과, 강원도 사망률과 관계된 주요 변수로는 자기지역 병원 인프라 이용률, 소득수준, 고령화 및 인구 밀도 등으로 나타났다. 따라서 소득격차에 따른 불평등과 지역 의료 인프라 부족 등은 지역의 사망률에 부정적 영향을 미치고 있는 것으로 나타나고 있어, 지역 병원 인프라 개선 및 소득 수준 향상을 위한 지역별 맞춤형 정책지원이 필요하다. 본 연구의 결과는 의료 빅데이터를 활용하여 강원도민 사망자를 분석하고, 다양한 사회 지표와 상관분석을 통해 그 원인을 파악해 보았다는 점에서 연구의 의의가 있다.
의료정보의 급속한 발달로 인하여 막대한 의료 빅데이터 정보가 축적되고 있다. 이러한 의료 빅데이터는 고령화와 의료비의 가파른 상승을 해결하는데 중요한 자료로 활용될 가능성이 큰 분야이다. 특히 한국의 경우 전 국민대상 주민등록번호와 전산화된 이용 자료들을 기반으로 빅데이터를 활용할 수 있는 의료 인프라 측면에서는 다른 국가에 비해 우위를 점할 수 있다. 본 연구에서는 국민건강보험공단 빅데이터 자료와 통계청 사망자 데이터를 활용하여 강원도의 사망자 분석 및 사망률에 영향을 미치는 요인을 분석하기 위해 상관분석을 수행한 후 시사점을 도출하였다. 분석 결과, 강원도 사망률과 관계된 주요 변수로는 자기지역 병원 인프라 이용률, 소득수준, 고령화 및 인구 밀도 등으로 나타났다. 따라서 소득격차에 따른 불평등과 지역 의료 인프라 부족 등은 지역의 사망률에 부정적 영향을 미치고 있는 것으로 나타나고 있어, 지역 병원 인프라 개선 및 소득 수준 향상을 위한 지역별 맞춤형 정책지원이 필요하다. 본 연구의 결과는 의료 빅데이터를 활용하여 강원도민 사망자를 분석하고, 다양한 사회 지표와 상관분석을 통해 그 원인을 파악해 보았다는 점에서 연구의 의의가 있다.
Due to the rapid development of medical information, vast amounts of medical data are accumulating, and such medical data is highly likely to be used as an important data for solving the aging population and the rapid rise in medical cost. Especially in Korea, there are resident registration numbers...
Due to the rapid development of medical information, vast amounts of medical data are accumulating, and such medical data is highly likely to be used as an important data for solving the aging population and the rapid rise in medical cost. Especially in Korea, there are resident registration numbers and computerized usage data for all citizens, so it can be superior to other countries in terms of medical infrastructure that can utilize big data. The purpose of this study was to analyze the factors affecting the mortality and death rate of Gangwon using the Big Data and the National Statistical Office data centered on Kangwon province. As a result of analysis, major variables related to the mortality rate of Gangwon were hospital infrastructure utilization rate, income level, aging population and population density. Therefore, inequalities due to income disparities and insufficient local medical infrastructures were affecting the local mortality rate, and policy support was needed to improve the local hospital infrastructure and income level. The results of this study were meaningful in that medical big data were used to analyze the deaths of people in Gangwon, and the causes of the deaths were analyzed through various social indicators and correlation analysis.
Due to the rapid development of medical information, vast amounts of medical data are accumulating, and such medical data is highly likely to be used as an important data for solving the aging population and the rapid rise in medical cost. Especially in Korea, there are resident registration numbers and computerized usage data for all citizens, so it can be superior to other countries in terms of medical infrastructure that can utilize big data. The purpose of this study was to analyze the factors affecting the mortality and death rate of Gangwon using the Big Data and the National Statistical Office data centered on Kangwon province. As a result of analysis, major variables related to the mortality rate of Gangwon were hospital infrastructure utilization rate, income level, aging population and population density. Therefore, inequalities due to income disparities and insufficient local medical infrastructures were affecting the local mortality rate, and policy support was needed to improve the local hospital infrastructure and income level. The results of this study were meaningful in that medical big data were used to analyze the deaths of people in Gangwon, and the causes of the deaths were analyzed through various social indicators and correlation analysis.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 고령화와 의료비의 가파른 상승, 소득격차에 따른 건강불평등 문제 해결을 위해 의료 빅데이터를 활용하여 그 원인을 파악하고자 하였다.
본 연구에서는 강원도 주요 사망자 데이터를 분석하고, 각 변수간 상관분석을 통해 강원도 사망률에 영향을 미치는 주요 변수들이 어떠한 것인지를 파악하였다. 이를 위해, 국민건강보험공단에서 제공하는 맞춤형 DB 를 신청하여 국민건강보험공단 내 빅데이터 서버에서 SAS 프로그램을 활용하여 2002년부터 2015년까지 강원도민 전수데이터 약 670GB 데이터를 구축하였다.
본 연구에서는 강원도를 중심으로 국민건강보험공단 의료 빅데이터와 통계청에서 제공하는 사망자 분석 정보를 활용하여 사망자 분석 및 사망률에 영향을 미치는 주요 요인들에 대해 살펴보고, 그 시사점을 도출하였다.
제안 방법
또한, 분석된 결과를 바탕으로 기타 통계청에서 제공하는 GRDP, 인구밀도, 지역별 고령화 지수 등과 같이 상관분석을 수행하여 지역 내 사망자와의 관계에 대해 분석을 수행하였다.
주요 분석사항으로는 지역별 인구 10만명 당 사망자 수, 성별, 연령, 소득수준, 인프라 분석, 직업, 혼인상태, 교육정도, 사망장소, 사망원인 분석 등을 수행하였다. 지역별 인구 10만명 당 사망자 수 분석에 있어서 인구 정보는 통계청에서 제공하는 주민등록상 인구 수를 활용하여 분석을 수행하였다.
주요 분석사항으로는 지역별 인구 10만명 당 사망자 수, 성별, 연령, 소득수준, 인프라 분석, 직업, 혼인상태, 교육정도, 사망장소, 사망원인 분석 등을 수행하였다. 지역별 인구 10만명 당 사망자 수 분석에 있어서 인구 정보는 통계청에서 제공하는 주민등록상 인구 수를 활용하여 분석을 수행하였다.
대상 데이터
이를 위해, 국민건강보험공단에서 제공하는 맞춤형 DB 를 신청하여 국민건강보험공단 내 빅데이터 서버에서 SAS 프로그램을 활용하여 2002년부터 2015년까지 강원도민 전수데이터 약 670GB 데이터를 구축하였다. 그 이후 구축된 데이터를 통계청 2015~2016년 강원도 주소로 된 사망자 21,826명의 데이터와 연계하여 분석을 수행하였다. 국민건강보험공단 빅데이터에서 제공하는 정보는 강원도에 주소가 등록된 환자의 보험료(20분위) 정보, 읍·면·동 단위의 주소 및 이용병원의 주소 정보가 기록되어 있으며, 통계청에서 제공하는 사망자 정보는 직업, 교육상태, 혼인상태, 사망원인 등이 기록되어 있다.
본 연구에서는 강원도 주요 사망자 데이터를 분석하고, 각 변수간 상관분석을 통해 강원도 사망률에 영향을 미치는 주요 변수들이 어떠한 것인지를 파악하였다. 이를 위해, 국민건강보험공단에서 제공하는 맞춤형 DB 를 신청하여 국민건강보험공단 내 빅데이터 서버에서 SAS 프로그램을 활용하여 2002년부터 2015년까지 강원도민 전수데이터 약 670GB 데이터를 구축하였다. 그 이후 구축된 데이터를 통계청 2015~2016년 강원도 주소로 된 사망자 21,826명의 데이터와 연계하여 분석을 수행하였다.
지금까지 국민건강보험공단 데이터와 통계청 사망자 데이터를 연계하여 강원도민 2015년, 2016년 사망자 데이터를 분석하였다. 분석결과, 강원도 사망자는 61세 이상의 고령층이 큰 비중을 차지하고 있으며 저소득 계층을 중심으로 사망자 비중이 높은 것으로 나타났다.
성능/효과
강원도 소득격차가 심화되는 상황에서 강원도 사망자 소득수준이 가장 낮은 차상위 계층 비율을 지역별로 살펴보면, 정선군과 고성군이 각각 8.7%, 8.6%로 나타나 상대적으로 사망자 중 차상위계층의 비율이 높은 것으로 나타났다.
강원도 주민의 국민건강보험공단 데이터와 통계청 사망자 데이터를 연계하여 강원도 18개 시·군별로 분석한 결과와 통계청에서 발표한 18개 시군별 지역별 고령화 비율, GRDP, 인구밀도 데이터 사이에 상관분석을 수행한 결과, 지역 소득수준이 낮은 지역일수록, 인구밀도가 낮은 지역일수록, 자기 지역의 병원을 이용하는 비율이 낮을수록 인구 10만명 당 사망자 수가 높은 것으로 나타났다.
국민건강보험공단과 통계청 사망자 데이터를 연계하여 분석한 결과, 2015~2016년 강원도 내 사망자 성별 비중은 남성이 55%, 여성이 45%를 차지하여 상대적으로 남성의 비율이 높은 것으로 나타났다.
이는 강원도의 고령화가 심화되는 상황에서 소득이 낮은 사람들을 중심으로 건강 상태 점검 및 지속적인 관리가 필요하다. 두 번째, 강원도 주요 통계분석 결과 간 상관분석 결과에서도 나타난 바와 같이 지역 내 병원 인프라 수준은 해당 지역의 사망률에 큰 영향을 미치는 요인 중 하나이다. 따라서 지역 내 병원 인프라 개선 또는 확충을 통해 지역 내 사망률을 낮추기 위한 정책 수립이 필요하다.
강원도 주민의 국민건강보험공단 데이터와 통계청 사망자 데이터를 연계하여 강원도 18개 시·군별로 분석한 결과와 통계청에서 발표한 18개 시군별 지역별 고령화 비율, GRDP, 인구밀도 데이터 사이에 상관분석을 수행한 결과, 지역 소득수준이 낮은 지역일수록, 인구밀도가 낮은 지역일수록, 자기 지역의 병원을 이용하는 비율이 낮을수록 인구 10만명 당 사망자 수가 높은 것으로 나타났다. 또한 사망자 중 차상위 비율이 높은 지역일수록, 고령화가 높은 지역일수록 인구 10만명 당 사망자의 수가 높은 것으로 나타났다.
지역별로 사망률을 살펴보면, 인구 10만명 당 사망률은 폐광지역이 상대적으로 높으나, 차상위 계층 사망률은 접경지역이 대체로 높은 것으로 나타났다. 또한 주요 통계분석 간 상관분석결과, 고령층이 많은 지역일수록 인구밀도가 낮고 병원 인프라 이용 비율이 낮아 고령층에 대한 사망률이 큰 것으로 분석된다.
본 연구의 결과는 의료 빅데이터를 활용하여 강원도민 사망자를 분석하고, 다양한 사회 지표와 상관분석을 통해 그 원인을 파악해 보았다는 점에서 연구의 의의가 있다. 국민건강보험공단과 통계청에서 제공하는 데이 터는 전수 데이터이기 때문에 의료 상태를 파악하는데 있어 정확한 분석이 가능하다.
지금까지 국민건강보험공단 데이터와 통계청 사망자 데이터를 연계하여 강원도민 2015년, 2016년 사망자 데이터를 분석하였다. 분석결과, 강원도 사망자는 61세 이상의 고령층이 큰 비중을 차지하고 있으며 저소득 계층을 중심으로 사망자 비중이 높은 것으로 나타났다. 특히 차상위 계층이 많은 지역일수록 지역에 사망자가 많은 것으로 분석되었다.
특히 차상위 계층이 많은 지역일수록 지역에 사망자가 많은 것으로 분석되었다. 사망자의 교육수준은 전반적으로 낮은 것으로 나타났으며, 의료기관에서 사망하는 사람이 대부분이나 주택에서 사망하는 비중도 상대적으로 높은 것으로 나타났다. 주요 사망원인으로는 암질병에 의한 사망자가 가장 많았다.
사망자의 국민건강보험공단 20분위를 분석하면, 소득이 전혀 없거나 군인으로 분류되는 0분위가 3,923명으로 전체 18%, 차상위 계층인 1분위의 경우 1,231명으로 5%, 2~10분위에 해당하는 사람이 6,260명으로 29%를 차지하여 전반적으로 소득 수준이 낮은 것으로 나타났다.
국민건강보험공단 데이터 상, 수진자의 주소와 해당 수진자가 이용한 병원 주소를 매칭시켜 분석하면, 그림에서와 같이 춘천권, 속초권, 원주권 및 강릉권을 중심으로 병원 인프라를 이용하고 있는 것으로 나타났다. 상대적으로 춘천, 원주 및 강릉 지역에 거주하는 주민들은 살고 있는 지역의 병원을 이용하는 비율이 높았으며, 강원 남부 지역의 경우 자기 지역의 병원을 이용하는 비율이 매우 낮은 것으로 분석되었다
특히 폐암, 간암 등에 의한 사망자가 가장 큰 비중을 차지하고 있는 것으로 나타났다. 지역별로 사망률을 살펴보면, 인구 10만명 당 사망률은 폐광지역이 상대적으로 높으나, 차상위 계층 사망률은 접경지역이 대체로 높은 것으로 나타났다. 또한 주요 통계분석 간 상관분석결과, 고령층이 많은 지역일수록 인구밀도가 낮고 병원 인프라 이용 비율이 낮아 고령층에 대한 사망률이 큰 것으로 분석된다.
주요 사망원인으로는 암질병에 의한 사망자가 가장 많았다. 특히 폐암, 간암 등에 의한 사망자가 가장 큰 비중을 차지하고 있는 것으로 나타났다. 지역별로 사망률을 살펴보면, 인구 10만명 당 사망률은 폐광지역이 상대적으로 높으나, 차상위 계층 사망률은 접경지역이 대체로 높은 것으로 나타났다.
후속연구
이러한 의료 빅데이터는 다양한 사회 지표와 같이 연계하여 분석을 하는 경우 현실적인 정책 대안을 수립이 가능하기 때문에 연구의 가치가 있다. 그러나 본 연구는 강원도 사망자 데이터를 활용한 원인분석에 있어 의료 빅데이터를 활용하여 요약 통계량 및 상관분석 정도에 그쳤다는 한계가 있다. 향후 연구에서는 요인분석 등을 통해 변수 간 선후 관계를 파악하여 의료 빅데이터를 활용한 건강관리 시스템 구축 등에 대한 연구가 추가로 필요하다.
그러나 본 연구는 강원도 사망자 데이터를 활용한 원인분석에 있어 의료 빅데이터를 활용하여 요약 통계량 및 상관분석 정도에 그쳤다는 한계가 있다. 향후 연구에서는 요인분석 등을 통해 변수 간 선후 관계를 파악하여 의료 빅데이터를 활용한 건강관리 시스템 구축 등에 대한 연구가 추가로 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
빅데이터가 국가 경쟁력을 높이는 이유는?
빅데이터(big data)는 기존의 데이터베이스 관리도구가 수집, 저장, 관리, 분석하는 범위를 넘어서는 규모의 데이터로 정의되지만, 이의 활용은 양적인 개념에 국한되지 않고 데이터의 분석과 활용의 전 과정을 포괄한다[2]. 빅데이터는 방대한 자료의 분석을 통해 미래를 예측하는 기반을 마련해 주기 때문에 국가의 미래 경쟁력을 좌우할 수 있는 핵심요인으로 평가 받고 있다. 세계경제포럼은 2012년 가장 주목해야 할 과학기술로 빅데이터 분야를 선정하였다[3].
빅데이터란 무엇인가?
이에 대한 대안으로 빅데이터의 활용에 대한 목소리가 높다[1]. 빅데이터(big data)는 기존의 데이터베이스 관리도구가 수집, 저장, 관리, 분석하는 범위를 넘어서는 규모의 데이터로 정의되지만, 이의 활용은 양적인 개념에 국한되지 않고 데이터의 분석과 활용의 전 과정을 포괄한다[2]. 빅데이터는 방대한 자료의 분석을 통해 미래를 예측하는 기반을 마련해 주기 때문에 국가의 미래 경쟁력을 좌우할 수 있는 핵심요인으로 평가 받고 있다.
의료 빅데이터를 통해 우리나라가 보건의료 분야에서 우위를 가질 수 있는 이유는?
우리나라는 전 국민대상 주민등록번호와 전산화된 의료 이용자료들이 있기에 빅데이터를 활용할 수 있는 인프라 측면에서는 선진국과의 경쟁에서 충분히 비교 우위를 점할 수 있다. 이를 이용하여 질병의 원인적 연 관성, 치료효과 파악 및 보건의료 분야 정책 입안에 필요한 근거들을 효율적으로 생성할 수 있다.
J. Manyika, M. Chui, B. Brown, J. Bughin, R. Dobbs, and C. Roxburgh, Big data: the next frontier for innovation, competition, and productivity, Lexington: McKinsey; 2011.
World Economic Forum. Big data, big impact: new possibilities for international development. Geneva: World Economic Forum; 2012.
S. J. Ko and Y. H. Chung, "Health risk prediction using big health data," Health welf Policy Forum, Vol.193, pp.43-52, 2012.
이병엽, 임종태, 유재수, "빅 데이터를 이용한 소셜 미디어 분석 기법의 활용," 한국콘텐츠학회논문지, Vol.13, No.2, pp.211-219, 2013.
P. Groves, B. Kayyali, D. Knott, and S. V. Kuiken, The 'big data' revo-lution in health care: accelerating value and innovation, Lexington: McKinsey Global Institute; 2013.
HSCIC. www.hscic.gov.uk/article/2656/
ONC HHS, Federal Health IT Stratetic Plan 2015-2020, 2014.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.