현대 사회에서는 고령화, 구도심 공동화, 도시 내 양극화 등 많은 도시문제들이 발생하고 있다. 이 중 본 연구에서는 빅 데이터와 기계학습 방법론을 적용해 노인 인구의 우울증상을 조기에 예측하여 노인 우울증 문제를 해결하는데 기여하고자 한다. 기계학습 기법은 랜덤포레스트를 활용하였고, 세계적으로 널리 사용되고 있는 우울 진단 척도인 CES-D10과 다른 변인들 간의 상관관계를 분석하여 중요 변수들을 추정하였다. 종속변수로는 정상/우울을 구별하는 변수와, 경도 우울/중증 우울을 구별하는 변수 총 2가지로 설정하였고, ...
현대 사회에서는 고령화, 구도심 공동화, 도시 내 양극화 등 많은 도시문제들이 발생하고 있다. 이 중 본 연구에서는 빅 데이터와 기계학습 방법론을 적용해 노인 인구의 우울증상을 조기에 예측하여 노인 우울증 문제를 해결하는데 기여하고자 한다. 기계학습 기법은 랜덤포레스트를 활용하였고, 세계적으로 널리 사용되고 있는 우울 진단 척도인 CES-D10과 다른 변인들 간의 상관관계를 분석하여 중요 변수들을 추정하였다. 종속변수로는 정상/우울을 구별하는 변수와, 경도 우울/중증 우울을 구별하는 변수 총 2가지로 설정하였고, 독립변수는 총 106개로 인적속성, 건강, 고용, 가구배경, 소득, 소비, 자산, 주관적 기대감, 삶의 질 설문으로 연구 대상자인 노년층의 객관적 특성 변수뿐 아니라 주관적 건강상태, 인지능력, 일상생활 수행 능력 등 응답자가 스스로 평가하는 특성까지 포함시켰다. 연구결과 노인우울증 여부를 분류하는데 거주지와 삶의 질에 대한 만족도, 인지기능점수가 중요한 영향을 미쳤고, 노인우울 정도를 분류하는데 거주지역과 삶의 질과 경제상황의 만족도, 병/의원 외래진료 횟수가 중요 변수로 나타났다. 또한 랜덤포레스트의 성능평가 결과 노인우울증 여부를 분류하는 모형의 정확도는 86.3%, 민감도 79.5%, 특이도 93.3%로 나타났으며, 노인우울 정도를 분류하는 모형의 정확도는 86.1%, 민감도 93.9%, 특이도 74.7%로 나타났다.
현대 사회에서는 고령화, 구도심 공동화, 도시 내 양극화 등 많은 도시문제들이 발생하고 있다. 이 중 본 연구에서는 빅 데이터와 기계학습 방법론을 적용해 노인 인구의 우울증상을 조기에 예측하여 노인 우울증 문제를 해결하는데 기여하고자 한다. 기계학습 기법은 랜덤포레스트를 활용하였고, 세계적으로 널리 사용되고 있는 우울 진단 척도인 CES-D10과 다른 변인들 간의 상관관계를 분석하여 중요 변수들을 추정하였다. 종속변수로는 정상/우울을 구별하는 변수와, 경도 우울/중증 우울을 구별하는 변수 총 2가지로 설정하였고, 독립변수는 총 106개로 인적속성, 건강, 고용, 가구배경, 소득, 소비, 자산, 주관적 기대감, 삶의 질 설문으로 연구 대상자인 노년층의 객관적 특성 변수뿐 아니라 주관적 건강상태, 인지능력, 일상생활 수행 능력 등 응답자가 스스로 평가하는 특성까지 포함시켰다. 연구결과 노인우울증 여부를 분류하는데 거주지와 삶의 질에 대한 만족도, 인지기능점수가 중요한 영향을 미쳤고, 노인우울 정도를 분류하는데 거주지역과 삶의 질과 경제상황의 만족도, 병/의원 외래진료 횟수가 중요 변수로 나타났다. 또한 랜덤포레스트의 성능평가 결과 노인우울증 여부를 분류하는 모형의 정확도는 86.3%, 민감도 79.5%, 특이도 93.3%로 나타났으며, 노인우울 정도를 분류하는 모형의 정확도는 86.1%, 민감도 93.9%, 특이도 74.7%로 나타났다.
In modern society, many urban problems are occurring, such as aging, hollowing out old city centers and polarization within cities. In this study, we intend to apply big data and machine learning methodologies to predict depression symptoms in the elderly population early on, thus contributing to so...
In modern society, many urban problems are occurring, such as aging, hollowing out old city centers and polarization within cities. In this study, we intend to apply big data and machine learning methodologies to predict depression symptoms in the elderly population early on, thus contributing to solving the problem of elderly depression. Mechanical learning techniques used random forest and analyzed the correlation between CES-D10 and other variables, which are widely used worldwide, to estimate important variables. Dependent variables were set up as two variables that distinguish normal/depression from moderate/severe depression, and a total of 106 independent variables were included, including subjective health conditions, cognitive abilities, and daily life quality surveys, as well as the objective characteristics of the elderly as well as the subjective health, health, employment, household background, income, consumption, assets, subjective expectations, and quality of life surveys. Studies have shown that satisfaction with residential areas and quality of life and cognitive ability scores have important effects in classifying elderly depression, satisfaction with living quality and economic conditions, and number of outpatient care in living areas and clinics have been important variables. In addition, the results of a random forest performance evaluation, the accuracy of classification model that classify whether elderly depression or not was 86.3%, the sensitivity 79.5%, and the specificity 93.3%. And the accuracy of classification model the degree of elderly depression was 86.1%, sensitivity 93.9% and specificity 74.7%.
In modern society, many urban problems are occurring, such as aging, hollowing out old city centers and polarization within cities. In this study, we intend to apply big data and machine learning methodologies to predict depression symptoms in the elderly population early on, thus contributing to solving the problem of elderly depression. Mechanical learning techniques used random forest and analyzed the correlation between CES-D10 and other variables, which are widely used worldwide, to estimate important variables. Dependent variables were set up as two variables that distinguish normal/depression from moderate/severe depression, and a total of 106 independent variables were included, including subjective health conditions, cognitive abilities, and daily life quality surveys, as well as the objective characteristics of the elderly as well as the subjective health, health, employment, household background, income, consumption, assets, subjective expectations, and quality of life surveys. Studies have shown that satisfaction with residential areas and quality of life and cognitive ability scores have important effects in classifying elderly depression, satisfaction with living quality and economic conditions, and number of outpatient care in living areas and clinics have been important variables. In addition, the results of a random forest performance evaluation, the accuracy of classification model that classify whether elderly depression or not was 86.3%, the sensitivity 79.5%, and the specificity 93.3%. And the accuracy of classification model the degree of elderly depression was 86.1%, sensitivity 93.9% and specificity 74.7%.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.