[국내논문]한의 체중 조절 프로그램에 참여한 과체중, 비만 환자에서의 머신러닝 기법을 적용한 체중 감량 예측 연구 Application of Machine Learning to Predict Weight Loss in Overweight, and Obese Patients on Korean Medicine Weight Management Program원문보기
Objectives: The purpose of this study is to predict the weight loss by applying machine learning using real-world clinical data from overweight and obese adults on weight loss program in 4 Korean Medicine obesity clinics. Methods: From January, 2017 to May, 2019, we collected data from overweight an...
Objectives: The purpose of this study is to predict the weight loss by applying machine learning using real-world clinical data from overweight and obese adults on weight loss program in 4 Korean Medicine obesity clinics. Methods: From January, 2017 to May, 2019, we collected data from overweight and obese adults (BMI≥23 kg/m2) who registered for a 3-month Gamitaeeumjowi-tang prescription program. Predictive analysis was conducted at the time of three prescriptions, and the expected reduced rate and reduced weight at the next order of prescription were predicted as binary classification (classification benchmark: highest quartile, median, lowest quartile). For the median, further analysis was conducted after using the variable selection method. The data set for each analysis was 25,988 in the first, 6,304 in the second, and 833 in the third. 5-fold cross validation was used to prevent overfitting. Results: Prediction accuracy was increased from 1st to 2nd and 3rd analysis. After selecting the variables based on the median, artificial neural network showed the highest accuracy in 1st (54.69%), 2nd (73.52%), and 3rd (81.88%) prediction analysis based on reduced rate. The prediction performance was additionally confirmed through AUC, Random Forest showed the highest in 1st (0.640), 2nd (0.816), and 3rd (0.939) prediction analysis based on reduced weight. Conclusions: The prediction of weight loss by applying machine learning showed that the accuracy was improved by using the initial weight loss information. There is a possibility that it can be used to screen patients who need intensive intervention when expected weight loss is low.
Objectives: The purpose of this study is to predict the weight loss by applying machine learning using real-world clinical data from overweight and obese adults on weight loss program in 4 Korean Medicine obesity clinics. Methods: From January, 2017 to May, 2019, we collected data from overweight and obese adults (BMI≥23 kg/m2) who registered for a 3-month Gamitaeeumjowi-tang prescription program. Predictive analysis was conducted at the time of three prescriptions, and the expected reduced rate and reduced weight at the next order of prescription were predicted as binary classification (classification benchmark: highest quartile, median, lowest quartile). For the median, further analysis was conducted after using the variable selection method. The data set for each analysis was 25,988 in the first, 6,304 in the second, and 833 in the third. 5-fold cross validation was used to prevent overfitting. Results: Prediction accuracy was increased from 1st to 2nd and 3rd analysis. After selecting the variables based on the median, artificial neural network showed the highest accuracy in 1st (54.69%), 2nd (73.52%), and 3rd (81.88%) prediction analysis based on reduced rate. The prediction performance was additionally confirmed through AUC, Random Forest showed the highest in 1st (0.640), 2nd (0.816), and 3rd (0.939) prediction analysis based on reduced weight. Conclusions: The prediction of weight loss by applying machine learning showed that the accuracy was improved by using the initial weight loss information. There is a possibility that it can be used to screen patients who need intensive intervention when expected weight loss is low.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서, 본 연구에서는 한방비만프로그램을 시행한 과체중, 비만 성인 환자들을 대상으로 머신러닝을 적용하여 체중 감량 예측을 연구하고자 하였다. 본 연구의 최종 목표는 체중 감량 예측 모델에 필요한 중요 변수 탐색 및 체중 감량 예측 모델의 비교 분석으로 이를 위해 크게 두 부분으로 나누어 분석을 진행하였다.
따라서, 본 연구에서는 한방비만프로그램을 시행한 과체중, 비만 성인 환자들을 대상으로 머신러닝을 적용하여 체중 감량 예측을 연구하고자 하였다. 본 연구의 최종 목표는 체중 감량 예측 모델에 필요한 중요 변수 탐색 및 체중 감량 예측 모델의 비교 분석으로 이를 위해 크게 두 부분으로 나누어 분석을 진행하였다. 먼저, 선행연구를 바탕으로 본 연구에서 추출 가능한 모든 변수를 사용하여 변수 선택 없이 체중 감량 예측을 진행하였으며, 추가적으로, 중요변수를 선택하여 이를 바탕으로 체중 감량 예측 모델을 재검토하는 방식으로 진행되었다.
분류의 기준점을 중위 50%로 하여 추가 분석 시행 후 예측력을 평가함에 있어서 5-fold cross validation을 통해 얻어진 정확도 (accuracy) 이외에, receiver operating characteristics (ROC) 커브를 통해 area under the curve (AUC)의 값을 확인하여 추가적으로 모델성능을 평가하는데 사용하였으며, AUC의 값은 1에 가까울수록 더 좋은 성능을 의미한다. 체중 감량 4분위를 분류 기준점으로 했을 때 보다 AUC를 통해 추가적인 예측력 평가를 진행한 이유는 4분위중에서 중위 50%가 가장 설명력 있다고 판단하여 이를 본 연구의 최종 분류 기준점으로 삼았기 때문이며, 더불어 ROC 커브의 시각화를 통해 모델 성능의 변화를 한 눈에 살펴보기 위한 목적이었다.
인공지능의 한 분야인 머신러닝은 명시적인 지시를 위해 사람이 모든 상황을 세밀하게 코딩하지 않아도 컴퓨터 시스템이 데이터 내에 존재하는 관계,규칙, 패턴들을 탐색하여 스스로 배우고 개선해 나가는 알고리즘 및 통계 모델로 특히 대용량의 자료를 다루는데 유용하다15). 따라서, 본 연구에서는 한방 비만 임상 빅데이터 분석을 위해 DT, LR, RF, ANN 등의 머신러닝 기법을 사용하여 체중 감량 예측 연구를 진행하였다.
제안 방법
본 연구의 최종 목표는 체중 감량 예측 모델에 필요한 중요 변수 탐색 및 체중 감량 예측 모델의 비교 분석으로 이를 위해 크게 두 부분으로 나누어 분석을 진행하였다. 먼저, 선행연구를 바탕으로 본 연구에서 추출 가능한 모든 변수를 사용하여 변수 선택 없이 체중 감량 예측을 진행하였으며, 추가적으로, 중요변수를 선택하여 이를 바탕으로 체중 감량 예측 모델을 재검토하는 방식으로 진행되었다.
가미태음조위탕은 총 3개월간 약 한 달 간격으로 총 3회 투여되었다. 예측 분석은 가미태음조위탕 총 3회의 각 처방 시점에서 이루어졌으며, 그 다음 차수 처방 시 예상되는 체중 감량률 및 감량 체중을 머신러닝 기법을 적용하여 분류의 기준점이 되는 부분을 넘길 것인지, 넘기지 못할 것인지 예측이 이루어지는 이분형으로 예측 (binary classification)하는 방식으로 이루어졌다. 본 연구는 분류의 기준점 및 변수 선택 기법 적용 유무에 따라 크게 두 가지 종류의 분석으로 이루어졌다.
예측 분석은 가미태음조위탕 총 3회의 각 처방 시점에서 이루어졌으며, 그 다음 차수 처방 시 예상되는 체중 감량률 및 감량 체중을 머신러닝 기법을 적용하여 분류의 기준점이 되는 부분을 넘길 것인지, 넘기지 못할 것인지 예측이 이루어지는 이분형으로 예측 (binary classification)하는 방식으로 이루어졌다. 본 연구는 분류의 기준점 및 변수 선택 기법 적용 유무에 따라 크게 두 가지 종류의 분석으로 이루어졌다. 첫 번째 분석에서는 변수 선택 없이 모든 입력변수 (독립변수)를 사용하여 본원에서 가미태음조위탕을 복용한 모집단의 데이터를 바탕으로 체중 감량 정도를 감량률과 감량 체중을 기준으로 각각 4분위 (상위 25%, 중위 50%, 하위 25%)로 구분하여 이를 분류의 기준점을 삼아 예측이 진행되었으며, 이에 사용된 각 모델별 예측 정확도를 비교 분석하였다.
본 연구는 분류의 기준점 및 변수 선택 기법 적용 유무에 따라 크게 두 가지 종류의 분석으로 이루어졌다. 첫 번째 분석에서는 변수 선택 없이 모든 입력변수 (독립변수)를 사용하여 본원에서 가미태음조위탕을 복용한 모집단의 데이터를 바탕으로 체중 감량 정도를 감량률과 감량 체중을 기준으로 각각 4분위 (상위 25%, 중위 50%, 하위 25%)로 구분하여 이를 분류의 기준점을 삼아 예측이 진행되었으며, 이에 사용된 각 모델별 예측 정확도를 비교 분석하였다. 두 번째 분석에서는 분류의 기준을 체중 감량 중위 50%로 두었을 경우를 바탕으로 중요 변수를 선택하여 각 모델별 성능을 추가 분석하였다.
첫 번째 분석에서는 변수 선택 없이 모든 입력변수 (독립변수)를 사용하여 본원에서 가미태음조위탕을 복용한 모집단의 데이터를 바탕으로 체중 감량 정도를 감량률과 감량 체중을 기준으로 각각 4분위 (상위 25%, 중위 50%, 하위 25%)로 구분하여 이를 분류의 기준점을 삼아 예측이 진행되었으며, 이에 사용된 각 모델별 예측 정확도를 비교 분석하였다. 두 번째 분석에서는 분류의 기준을 체중 감량 중위 50%로 두었을 경우를 바탕으로 중요 변수를 선택하여 각 모델별 성능을 추가 분석하였다. 큰 줄기인 두 가지 분석 내에서 각각 1차, 2차, 3차 예측 분석이 세부적으로 시행되었다.
두 번째 분석에서는 분류의 기준을 체중 감량 중위 50%로 두었을 경우를 바탕으로 중요 변수를 선택하여 각 모델별 성능을 추가 분석하였다. 큰 줄기인 두 가지 분석 내에서 각각 1차, 2차, 3차 예측 분석이 세부적으로 시행되었다.
전체적인 데이터 분석의 과정은 데이터 수집, 데이터 정제 및 전처리, 탐색적 데이터 분석, 모델링 기법 선택 및 모델링 수행, 검증 및 평가의 과정으로 이루어졌다(Figure 2).
총 3개월 간의 비만 프로그램 동안 가미태음조위탕 (1일 복용량. 마황 16~20g, 숙지황 8g, 의이인 8g, 생강 4g, 석창포 3.3g, 산조인 3.3g, 택사 2.6g, 황금 1.3g, 오미자 1.3g, 갈근 1.3g, 천문동 1.3g, 고본 1.3g, 용안육 1.3g, 건율 1.3g, 맥문동 1.3g) 처방은 약 한 달 간격으로 총 3회에 걸쳐 이루어졌다. 마황의 용량은 체중 및 발현 증상 변화에 따라 조절되었으며, 초진 방문 시 한식 위주의 균형 있는 식단을 바탕으로 한 저열량식이 및 산책, 스트레칭 등을 통한 신체 활동 유지 권장 등 체중 감량을 위한 일반적인 조언이 함께 이루어졌다.
마황의 용량은 체중 및 발현 증상 변화에 따라 조절되었으며, 초진 방문 시 한식 위주의 균형 있는 식단을 바탕으로 한 저열량식이 및 산책, 스트레칭 등을 통한 신체 활동 유지 권장 등 체중 감량을 위한 일반적인 조언이 함께 이루어졌다. 처방 약물은 1일 복용량 한약을 달여서 동결건조한 정제 (550 mg/정)의 형태로 1회 3정, 1일 3회 복용하였다.
체중 감량 4분위 기준 분석과 체중 감량 중위 50% 기준 추가 분석 내에서 각각 1, 2, 3차 예측 분석이 세부적으로 이루어졌다. 1차 예측 분석은 1차 처방 시점에서 이루어졌으며, 2차 처방이 이루어지는 시점의 체중 감량 (1~2차 처방 사이에 발생하는 체중 감량률, 감량 체중)을 초진 정보를 활용하여 예측하였다.
체중 감량 4분위 기준 분석과 체중 감량 중위 50% 기준 추가 분석 내에서 각각 1, 2, 3차 예측 분석이 세부적으로 이루어졌다. 1차 예측 분석은 1차 처방 시점에서 이루어졌으며, 2차 처방이 이루어지는 시점의 체중 감량 (1~2차 처방 사이에 발생하는 체중 감량률, 감량 체중)을 초진 정보를 활용하여 예측하였다. 2차 예측 분석은 2차 처방 시점에서 이루어졌으며, 3차 처방이 이루어지는 시점의 체중 감량(1~3차 처방 사이에 발생하는 체중 감량률, 감량 체중)을 초진 정보와 1-2차 약 복용 사이에 발생한 추가 정보를 활용하여 예측하였다.
1차 예측 분석은 1차 처방 시점에서 이루어졌으며, 2차 처방이 이루어지는 시점의 체중 감량 (1~2차 처방 사이에 발생하는 체중 감량률, 감량 체중)을 초진 정보를 활용하여 예측하였다. 2차 예측 분석은 2차 처방 시점에서 이루어졌으며, 3차 처방이 이루어지는 시점의 체중 감량(1~3차 처방 사이에 발생하는 체중 감량률, 감량 체중)을 초진 정보와 1-2차 약 복용 사이에 발생한 추가 정보를 활용하여 예측하였다. 3차 예측 분석은 3차 처방 시점에서 이루어졌으며, 최종 체중 보고가 이루어지는 시점의 체중 감량 (1차 처방~최종 체중 보고 사이에 발생하는 체중 감량률, 감량 체중)을 초진 정보, 1-2차 및 2-3차 약 복용 사이에 발생한 추가 정보를 활용하여 예측하였다(Figure 3).
2차 예측 분석은 2차 처방 시점에서 이루어졌으며, 3차 처방이 이루어지는 시점의 체중 감량(1~3차 처방 사이에 발생하는 체중 감량률, 감량 체중)을 초진 정보와 1-2차 약 복용 사이에 발생한 추가 정보를 활용하여 예측하였다. 3차 예측 분석은 3차 처방 시점에서 이루어졌으며, 최종 체중 보고가 이루어지는 시점의 체중 감량 (1차 처방~최종 체중 보고 사이에 발생하는 체중 감량률, 감량 체중)을 초진 정보, 1-2차 및 2-3차 약 복용 사이에 발생한 추가 정보를 활용하여 예측하였다(Figure 3).
‘속성 선택 기법 (feature selection method)’의 하나인 ‘보루타 알고리즘 (Boruta Algorithm)’26)을 통해 의미 있는 변수를 선택한 후, 변수들의 선택이 잘 이루어져서 안정적으로 예측 정확도가 향상되는지 확인하기 위해 ‘변수 중요도 (feature importance)’에 따라 중요도가 낮은 변수에서 높은 변수 순서로 추가하면서 모델 성능이 변화하는 과정을 비교 검토하였다(Table 4).
5 IQR (interquartile range)을 통해 구해진 이상치를 제거하고 결측치는 제외하였다. 재방문 기간은 각 차수 날짜 간의 차이를 구하여 추출하였고, BMI는 키와 방문 차수의 몸무게를 통하여 계산하여 구하였다. 감량 체중과 감량 BMI는 각 차수 때의 체중 혹은 BMI 간의 차이를 통하여 추출하였고, 감량률은 각 차수 간의 체중을 통해 아래와 같이 계산하여 추출하였다.
재방문 기간은 각 차수 날짜 간의 차이를 구하여 추출하였고, BMI는 키와 방문 차수의 몸무게를 통하여 계산하여 구하였다. 감량 체중과 감량 BMI는 각 차수 때의 체중 혹은 BMI 간의 차이를 통하여 추출하였고, 감량률은 각 차수 간의 체중을 통해 아래와 같이 계산하여 추출하였다.
2, 3차 예측 분석에서는 다이어트를 진행하면서 발생하는 추가 정보들을 변수로 활용하였으며, 각 처방 시점에서의 체중 및 BMI, 약 처방 사이의 기간, 감량률, 감량 체중, 감량 BMI 등이 연속형 변수로 분석에 추가되었으며, 추가 약접수시 방문의 유무, 마황 증량의 유무, 약 복용 후 발생한 기관계별 불편증상, 감량 만족도, 포만감 및 식욕억제는 범주형 변수로 추가되었다. 불편증상, 포만감, 감량만족도는 용언 (用言)의 활용이 많아 형태소 분석을 위해 MeCab을 사용하였으며, 불편증상은 선행연구25)를 참고하여 위장기관계, 중추 및 말초신경계, 신경 정신계, 자율신경계, 그 외 기타로 범주화 하여 추출하였다(Table 1).
본 연구의 체중 감량 예측은 이분형 분류 (binary classification) 형태로 시행되었다. 이분형 분류는 출력 변수 (labels)를 1 또는 0, 혹은 1 또는 -1로 예측하게 되는데, 본 연구에서는 예측 결과 분류의 기준점을 넘기면 1을 출력 (return)하고, 넘기지 못하면 0을 출력 (return)하도록 하였다.
본 연구의 체중 감량 예측은 이분형 분류 (binary classification) 형태로 시행되었다. 이분형 분류는 출력 변수 (labels)를 1 또는 0, 혹은 1 또는 -1로 예측하게 되는데, 본 연구에서는 예측 결과 분류의 기준점을 넘기면 1을 출력 (return)하고, 넘기지 못하면 0을 출력 (return)하도록 하였다. 연구는 분류의 기준점을 바탕으로 다음과 같이 크게 두 부분으로 진행되었다.
연구는 분류의 기준점을 바탕으로 다음과 같이 크게 두 부분으로 진행되었다. 첫째, 모든 변수를 사용하여 가미태음조위탕을 복용한 모집단의 감량률 (reduced rate), 감량 체중 (reduced weight)을 각각 4분위 (분류 기준점: 상위 25%, 중위 50%, 하위 25%)로 나누어서 1차 예측 분석, 2차 예측 분석, 3차 예측 분석을 진행하였다(Table 2). 체중 감량이 양호한 군과 저조한 군을 비교하기 위해 1차 예측 분석에서 1분위와 4분위에 해당하는 환자들의 신체 정보, 감량 정도를 초진 정보와 비교해 보았다(Table 3).
첫째, 모든 변수를 사용하여 가미태음조위탕을 복용한 모집단의 감량률 (reduced rate), 감량 체중 (reduced weight)을 각각 4분위 (분류 기준점: 상위 25%, 중위 50%, 하위 25%)로 나누어서 1차 예측 분석, 2차 예측 분석, 3차 예측 분석을 진행하였다(Table 2). 체중 감량이 양호한 군과 저조한 군을 비교하기 위해 1차 예측 분석에서 1분위와 4분위에 해당하는 환자들의 신체 정보, 감량 정도를 초진 정보와 비교해 보았다(Table 3). 둘째, 중요 변수를 탐색하기 위하여 체중 감량 4분위 중에서 감량률, 감량체중의 중위 50%를 기준으로 추가 분석을 시행하였다.
체중 감량이 양호한 군과 저조한 군을 비교하기 위해 1차 예측 분석에서 1분위와 4분위에 해당하는 환자들의 신체 정보, 감량 정도를 초진 정보와 비교해 보았다(Table 3). 둘째, 중요 변수를 탐색하기 위하여 체중 감량 4분위 중에서 감량률, 감량체중의 중위 50%를 기준으로 추가 분석을 시행하였다. ‘속성 선택 기법 (feature selection method)’의 하나인 ‘보루타 알고리즘 (Boruta Algorithm)’26)을 통해 의미 있는 변수를 선택한 후, 변수들의 선택이 잘 이루어져서 안정적으로 예측 정확도가 향상되는지 확인하기 위해 ‘변수 중요도 (feature importance)’에 따라 중요도가 낮은 변수에서 높은 변수 순서로 추가하면서 모델 성능이 변화하는 과정을 비교 검토하였다(Table 4).
이러한 방법을 앙상블 (ensemble) 기법 중에서 배깅(bagging) 기법이라고 한다. 앙상블 방법을 통하여 예측의 변동성이 줄어들어 정밀도가 좋고 예측 성능이 우수하며, 변수의 중요성을 파악할 수 있다는 장점을 가지고 있어 본 연구의 분석에 활용되었다. 하지만, DT에 비해 속도가 크게 떨어지며 내부를 들여다볼 수가 없어 해석이 어려운 단점이 존재한다27,28).
입력되는 독립변수와 출력되는 종속변수 사이에 복잡하고 다차원, 비선형 관계가 있을지라도 유연하게 모델링 할 수 있는 수학적인 알고리즘이다. 데이터가 많을 때 사용하기에 적절하고, 복잡한 비선형 관계를 찾아내는 능력과 변수들이 많을 때 접근할 수 있는 신뢰할 수 있는 모델이어서 본 연구 분석에 사용되었다. 한편, 각각의 독립변수가 종속변수에 어떤 영향을 미치는지 알 수 없는 블랙박스 (black box) 모델이며, 분석에 상당한 컴퓨터 자원과 시간이 요구된다는 단점이 있다27).
4; Python Software Foundation(PSF), Wilmington, Delaware, USA)을 사용하였다. 모델링 수행에 사용된 DT, RF, LR은 Scikit-learn을 ANN은 Keras를 메인 패키지로 사용하였다. 속성 선택 기법에 사용된 Boruta algorithm은 BorutaPy 패키지를 이용하였으며, 분산팽창지수 (Variance Inflation Factor, VIF)는 Statsmodels로 분석되었다.
5-fold cross validation은 사용할 전체 데이터를 5개의 블록으로 나누고, 한 블록을 테스트 세트 (test set)로 나머지는 훈련 세트(train set)가 되도록 하고, 이 과정을 5번 반복하여 모든 데이터가 테스트 데이터로 쓰이는 경우가 존재하도록 만든 검증 기법이다. 각 과정 (iteration)을 통해 나온 정확도 (accuracy)를 평가지표로 삼았으며 5번의 결과를 평균 내어 나온 값을 모델을 평가하는데 사용하였다. 매개변수 (Hyperparameter)의 선택은 매개 변수를 튜닝할 때 설정해 둔 각 범위에 대하여 가능한 모든 조합을 시도하여 모델링한 뒤 모델링 결과가 가장 좋은 매개 변수를 고르는 방법인 그리드 서치 (grid search)를 이용하였다.
가 낮은 순서에서 높은 순서로 추가하면서 모델 성능이 개선되는지 확인하는 과정을 거쳤다. 이 과정에서 변수가 하나씩 추가될 때 마다 반복적인 학습을 되풀이하게 되는데,이 때 발생하는 모델 학습 소요 시간을 합리적으로 단축하기 분산팽창지수 (Variance Inflation factor, VIF)를 확인하여 값이 10이 넘는 변수들 중 중요도가 낮은 변수들부터 차례로 제거하여 모든 변수들의 VIF가 10이 넘지 않도록 했다. 그 결과 감량률, 감량 체중 기준으로 1차 예측 분석에서는 각각 3개 중에 3개, 8개 중에 7개의 변수가, 2차 예측 분석에서는 각각 12개 중에 6개, 15개 중에 8개의 변수가, 그리고 3차 예측 분석에서는 각각 13개 중에 4개, 16개의 중에 4개의 변수가 남았다.
시각화를 통해 모델 성능 변화를 한눈에 파악하기 위한 목적으로 체중 감량 중위 50% 분류 기준점에서 변수 선택 후 진행한 분석에서는 ROC 커브를 통해 나오는 AUC의 값을 확인하여 추가적으로 모델성능을 비교하였으며, 각 차수의 예측 분석에서 모델별로 민감도, 특이도, AUC 값을 획득하였다(Table 5). 감량 체중 기준으로 RF에서 1차 (0.
본 연구의 체중 감량 예측은 정해진 체중 감량 성공 기준에 따라 감량 성공과 감량 실패를 예측한 선행연구들13,22)을 바탕으로 이분형 분류 (binary classification) 형태로 시행되었다. 다양한 선행연구9,10,13,34)에서 체중 감량의 성공 기준을 초기 체중의 5%를 감량한 것으로 설정하여 연구를 진행하였는데, 초기 체중의 5% 감량은 다양한 인체 기관에서 대사 기능을 개선시키는 것으로 알려져 있어35) 체중 감량 성공 기준으로 연구에 많이 적용된다.
본 연구에서는 DT, RF, LR, ANN 등의 머신러닝 기법을 적용하여 비만 프로그램을 진행한 과체중 및 비만 성인 환자들의 체중 감량 예측을 총 3회의 가미태음조위탕 약 처방 시점에서 이분형 분류 (binary classification) 형태로 시행하였다. 본 연구는 크게두 부분으로 나누어 분석을 진행하였는데, 첫 번째 분석은 변수 선택 없이 선행연구를 바탕으로 본 연구에서 추출 가능한 모든 변수를 사용하여 체중 감량 예측을 진행하였으며, 추가로 진행한 두 번째 분석은 중요 변수를 추출하여 이를 바탕으로 체중 감량 예측 모델을 재검토하는 방식으로 진행되었다.
본 연구에서는 DT, RF, LR, ANN 등의 머신러닝 기법을 적용하여 비만 프로그램을 진행한 과체중 및 비만 성인 환자들의 체중 감량 예측을 총 3회의 가미태음조위탕 약 처방 시점에서 이분형 분류 (binary classification) 형태로 시행하였다. 본 연구는 크게두 부분으로 나누어 분석을 진행하였는데, 첫 번째 분석은 변수 선택 없이 선행연구를 바탕으로 본 연구에서 추출 가능한 모든 변수를 사용하여 체중 감량 예측을 진행하였으며, 추가로 진행한 두 번째 분석은 중요 변수를 추출하여 이를 바탕으로 체중 감량 예측 모델을 재검토하는 방식으로 진행되었다.
가미태음조위탕은 총 3개월간 약 한 달 간격으로 총 3회 투여되었다. 예측 분석은 가미태음조위탕 총 3회의 각 처방 시점에서 이루어졌으며, 그 다음 차수 처방 시 예상되는 체중 감량률 및 감량 체중을 머신러닝 기법을 적용하여 분류의 기준점이 되는 부분을 넘길 것인지, 넘기지 못할 것인지 예측이 이루어지는 이분형으로 예측 (binary classification)하는 방식으로 이루어졌다.
3g) 처방은 약 한 달 간격으로 총 3회에 걸쳐 이루어졌다. 마황의 용량은 체중 및 발현 증상 변화에 따라 조절되었으며, 초진 방문 시 한식 위주의 균형 있는 식단을 바탕으로 한 저열량식이 및 산책, 스트레칭 등을 통한 신체 활동 유지 권장 등 체중 감량을 위한 일반적인 조언이 함께 이루어졌다. 처방 약물은 1일 복용량 한약을 달여서 동결건조한 정제 (550 mg/정)의 형태로 1회 3정, 1일 3회 복용하였다.
분류의 기준점을 중위 50%로 하여 추가 분석 시행 후 예측력을 평가함에 있어서 5-fold cross validation을 통해 얻어진 정확도 (accuracy) 이외에, receiver operating characteristics (ROC) 커브를 통해 area under the curve (AUC)의 값을 확인하여 추가적으로 모델성능을 평가하는데 사용하였으며, AUC의 값은 1에 가까울수록 더 좋은 성능을 의미한다. 체중 감량 4분위를 분류 기준점으로 했을 때 보다 AUC를 통해 추가적인 예측력 평가를 진행한 이유는 4분위중에서 중위 50%가 가장 설명력 있다고 판단하여 이를 본 연구의 최종 분류 기준점으로 삼았기 때문이며, 더불어 ROC 커브의 시각화를 통해 모델 성능의 변화를 한 눈에 살펴보기 위한 목적이었다.
대상 데이터
3개월 비만 프로그램에 등록한 66,645명 중에 중도탈락자와 체중 정보가 확인되지 않는 경우, 그리고 연구 방법에 제시된 복용약 이외의 약과 제형을 복용한 경우는 분석에서 제외되었으며, 개인 정보 제공에 동의한 18세 이상의 과체중 및 비만인 (body mass index (BMI) ≥23kg/m2)을 분석 대상자로 삼았다.
이 연구는 다기관, 후향적 연구로서 2017년 1월 4일부터 2019년 5월 30일까지 서울 및 경기도 소재 4개의 N 한방 비만 클리닉에 내원한 환자의 전자 의무기록 데이터를 한차트 (TNH, Gyeonggi-do, Korea)로부터 개인정보를 비식별화된 상태로 제공받아 분석에 사용하였다. 비만 센터에 내원한 모든 환자들은 치료 시작 전 기본적으로 개인정보 제공, 진료 및 연구에 대한 동의서를 작성하였다.
3개월 비만 프로그램에 등록한 66,645명 중에 중도탈락자와 체중 정보가 확인되지 않는 경우, 그리고 연구 방법에 제시된 복용약 이외의 약과 제형을 복용한 경우는 분석에서 제외되었으며, 개인 정보 제공에 동의한 18세 이상의 과체중 및 비만인 (body mass index (BMI) ≥23kg/m2)을 분석 대상자로 삼았다. 이 연구 프로토콜은 경희대학교 기관생명윤리위원회 (Institutional Review Board)의 승인을 받아 진행되었으며(KHSIRB-19-433), 연구 방법에 기반한 Dataset은 1차 예측 분석 25,988명, 2차 예측 분석 6,304명, 3차 예측 분석 833명이다(Figure 1).
체중 정보는 Inbody 370 ((주)인바디, 서울, 대한민국)를 통해 이루어졌으며, 신장의 측정은 BSM 330 ((주)인바디, 서울, 대한민국) 신장계를 사용하여 측정되었다. BMI는 측정된 체중 (kg)을 키 (m)의 제곱으로 나눈 값으로 계산하여 사용하였다.
전체 데이터는 비식별화된 환자의 기본 정보, 계측정보, 약 처방, 진료 노트가 모두 존재하는 사람을 대상으로 데이터를 추출했다. 제외 기준에 속하는 BMI가 23 kg/m2 미만인 사람과 18세 미만의 환자는 제외하였다.
DT는 불순도 (entropy)를 최소화하는 방식으로 이진 분할을 통해 유의미한 독립변수를 나누어 나가는데 그 모양이 나무의 가지가 갈라지는 모양과 유사하여 의사결정나무라고 불린다. 공선성에 강하며, 시각화가 가능하여 해석이 용이한 화이트 박스 (white box) 모델에 속하며, 수행을 빠르게 할 수 있고 컴퓨터 자원을 적게 소모하는 장점이 있어 본 연구에서 사용되었다. 한편, 과적합이 잘 되는 경향이 있고, 탐욕적 알고리즘을 기반으로 하기 때문에 최적해를 찾을 수 없는 경우도 발생한다는 단점이 있다13,27).
3차 체중 감량 예측 분석대상자는 833명으로 평균 연령은38.19 ± 10.42 세, 초진 시 체중은 73.96 ± 10.26kg, BMI는 28.3 ± 3.14 kg/m2, 2차 처방과 3차 처방 사이의 기간은 33.09 ± 6.53 일이었으며, 사용된 독립변수의 총 개수는 66개이다.
2차 체중 감량 예측 분석 대상자는 6,304명으로 평균 연령은 37.09 ± 10.25 세, 초진 시 체중은 72.51 ± 10.36 kg, BMI는 27.58 ± 3.02 kg/m2, 1차 처방과 2차 처방 사이의 기간은 25.72 ± 5.19 일이었으며, 다이어트를 진행하면서 발생한 정보를 추가하여 분석에 사용된 총 독립변수는 42개이다.
데이터처리
1. 체중 감량의 예측은 가미태음조위탕을 복용한 모집단의 감량률과 감량 체중의 4분위인 상위 25%, 중위 50%, 하위 25%를 분류의 기준점 (classification bench mark)으로 삼았으며, 각 기준점을 넘을 것인가를 맞추는 예측을 시행하여 정확도 (accuracy)를 5-fold cross validation으로 구하여 비교 분석하였다. 이 분석을 통하여, 체중 감량 중위 50%를 분류의 기준점으로 삼았을 때가 상하위 25%를 분류의 기준점으로 삼았을 때 보다 모델의 설명력이 더 좋음을 확인할 수 있었다.
이론/모형
본 연구에서는 비만 진료를 통해 축적된 임상 빅데이터 분석을 위한 머신러닝 알고리즘으로 의사결정나무 (Decision Tree, DT), 랜덤 포레스트 (Random Forest, RF), 로지스틱 회귀분석 (Logistic Regression, LR), 인공신경망 (Artificial Neural Network, ANN)을 사용하였다.
모델링 수행에 사용된 DT, RF, LR은 Scikit-learn을 ANN은 Keras를 메인 패키지로 사용하였다. 속성 선택 기법에 사용된 Boruta algorithm은 BorutaPy 패키지를 이용하였으며, 분산팽창지수 (Variance Inflation Factor, VIF)는 Statsmodels로 분석되었다. 속성 선택 기법을 통해 변수 선택이 이루어진 후 구한 변수 중요도는 RF 기반29,30)으로 결정되었다.
속성 선택 기법에 사용된 Boruta algorithm은 BorutaPy 패키지를 이용하였으며, 분산팽창지수 (Variance Inflation Factor, VIF)는 Statsmodels로 분석되었다. 속성 선택 기법을 통해 변수 선택이 이루어진 후 구한 변수 중요도는 RF 기반29,30)으로 결정되었다.
편향 (Underfitting)과 과적합 (overfitting)의 균형을 맞추기 위해 검증 및 평가에 5-fold cross validation을 사용하였다31). 5-fold cross validation은 사용할 전체 데이터를 5개의 블록으로 나누고, 한 블록을 테스트 세트 (test set)로 나머지는 훈련 세트(train set)가 되도록 하고, 이 과정을 5번 반복하여 모든 데이터가 테스트 데이터로 쓰이는 경우가 존재하도록 만든 검증 기법이다.
각 과정 (iteration)을 통해 나온 정확도 (accuracy)를 평가지표로 삼았으며 5번의 결과를 평균 내어 나온 값을 모델을 평가하는데 사용하였다. 매개변수 (Hyperparameter)의 선택은 매개 변수를 튜닝할 때 설정해 둔 각 범위에 대하여 가능한 모든 조합을 시도하여 모델링한 뒤 모델링 결과가 가장 좋은 매개 변수를 고르는 방법인 그리드 서치 (grid search)를 이용하였다.
체중 감량 4분위 분류 기준점 (classification benchmark)이라 함은 가미태음조위탕을 복용한 모집단의 감량률, 감량 체중의 상위 25%, 중위 50%, 하위 25%을 의미한다. 모델 성능은 5-fold cross validation으로 확인하였다(Table 2).
성능/효과
를 통해 체중 감량에 영향을 미치는 인자들을 바탕으로 변수들이 선택되었으며, 1차 예측 분석에서는 초진 정보 중에서 연령, 초기 체중, BMI 등은 연속 변수로 사용되었으며, 약의 용량, 성별, 식이 습관, 다이어트 경험, 병력 등은 진료 노트 부분에서 텍스트 마이닝 형태로 추출되어 범주형 변수로 사용되었다. 2, 3차 예측 분석에서는 다이어트를 진행하면서 발생하는 추가 정보들을 변수로 활용하였으며, 각 처방 시점에서의 체중 및 BMI, 약 처방 사이의 기간, 감량률, 감량 체중, 감량 BMI 등이 연속형 변수로 분석에 추가되었으며, 추가 약접수시 방문의 유무, 마황 증량의 유무, 약 복용 후 발생한 기관계별 불편증상, 감량 만족도, 포만감 및 식욕억제는 범주형 변수로 추가되었다. 불편증상, 포만감, 감량만족도는 용언 (用言)의 활용이 많아 형태소 분석을 위해 MeCab을 사용하였으며, 불편증상은 선행연구25)를 참고하여 위장기관계, 중추 및 말초신경계, 신경 정신계, 자율신경계, 그 외 기타로 범주화 하여 추출하였다(Table 1).
1차 체중 감량 예측 분석 대상자는 25,988명으로 평균 연령은 36.34 ± 10.5세, 체중은 72.69 ± 10.50kg, BMI는 27.60 ± 3.04 kg/m2 이었으며 남녀 비율은 남성은 8.82%, 여성은 91.18%로 여성의 비율이 우세하며 2차, 3차 분석에서도 근사한 비율을 유지하였다.
1차 처방 약 복용 후 2차 처방 시점에서 확인된 평균 체중 감량률은 3.77 ± 1.66 %, 평균 감량 체중은 2.74 ± 1.29 kg으로 4분위로 나누어 살펴본 하위 25%, 중위 50%, 상위 25%에 해당하는 감량률은 2.66%, 3.75%, 4.87%이며, 감량 체중은 1.9kg, 2.68kg,3.54kg이다.
3차 처방 약 복용 후 최종 체중 보고 시점에서 확인된 평균 체중 감량률은 8.74 ± 3.07 %, 평균 감량 체중은 6.50 ± 2.59 kg으로 4분위로 나누어 살펴본 하위 25%, 중위 50%, 상위 25%에 해당하는 감량률은 6.68%, 8.68%, 10.66%이며, 감량 체중은 4.72kg, 6.22kg, 8.02kg이다.
2차 처방 약 복용 후 3차 처방 시점에서 확인된 평균 체중 감량률은 6.54 ± 4.76 %, 평균 감량 체중은 4.76 ± 2.00 kg으로 4분위로 나누어 살펴본 하위 25%, 중위 50%, 상위 25%에 해당하는 감량률은 4.87%, 6.53%, 8.21%이며, 감량 체중은 3.44kg, 4.64kg, 5.94kg이다.
체중 감량이 양호한 군과 저조한 군을 비교하기 위해 1차 예측 분석에서 1분위와 4분위에 해당하는 환자들의 신체 정보, 감량 정도를 초진 정보와 비교해 본 결과 감량률, 감량 체중 기준 모두에서 감량 양호군 (1분위)에서 감량 저조군 (4분위)보다 상대적으로 연령이 낮고 다이어트 경험이 적은 경향이 있었으며, 감량 체중 기준으로는 감량 양호군에서 초기 비만도가 상대적으로 높은 것을 확인할 수 있었다(Table 3).
54kg이다. 상위 25%와 하위 25% 기준으로는 모델링의 결과가 감량률, 감량 체중 기준에 관계없이 모두 약 75% 전후로 나왔으며, 감량률 50%를 기준으로는 모델별로 53.41% (DT)에서 55.01% (ANN)이,감량 체중 50%를 기준으로는 59.47% (DT)에서 60.18% (RF)로 나왔다. 1차 예측 모델에서는 분류 기준점 체중 감량 50%에서 감량 체중을 기준으로 한 결과가 감량률 기준으로 한 결과보다 각 모델별로 약 5%정도 높게 나왔다.
18% (RF)로 나왔다. 1차 예측 모델에서는 분류 기준점 체중 감량 50%에서 감량 체중을 기준으로 한 결과가 감량률 기준으로 한 결과보다 각 모델별로 약 5%정도 높게 나왔다.
상위 25%와 하위 25% 기준으로는 모델링의 결과 값은 약 80% 전후로 나왔다. 중위 50% 기준으로는 71.04 % (감량률 기준, DT)에서75.79% (감량체중 기준, ANN)까지 분포하고 있으며, 1차 모델에서 감량률 기준과 감량체중 기준 결과의 차이가 약 5%로 나타났는데 2차 모델에서는 그차이가 2% 정도로 줄어 들었다. 체중 감량 4분위 기준별 모델링의 결과 값들이 1차 분석 결과 값과 비교 시 모두 상승하였으며, 2차 예측 분석부터는 1차에서 나왔던 상하위 25% 기준으로 한 가지 정답만 계속 고르더라도 나올 수 있는 정확도인 75%를 벗어나 약 80% 전후의 결과 값들이 나왔다.
79% (감량체중 기준, ANN)까지 분포하고 있으며, 1차 모델에서 감량률 기준과 감량체중 기준 결과의 차이가 약 5%로 나타났는데 2차 모델에서는 그차이가 2% 정도로 줄어 들었다. 체중 감량 4분위 기준별 모델링의 결과 값들이 1차 분석 결과 값과 비교 시 모두 상승하였으며, 2차 예측 분석부터는 1차에서 나왔던 상하위 25% 기준으로 한 가지 정답만 계속 고르더라도 나올 수 있는 정확도인 75%를 벗어나 약 80% 전후의 결과 값들이 나왔다. 이로부터 2차 예측 분석에서는 설명력 있는 변수가 추가되어 1차 분석 때와는 다른 방법으로 예측이 진행되고 있음을 추정해 볼 수 있다.
02kg이다. 상위 25% 기준으로는 86% (감량률 기준, DT)에서 90%까지의 예측 정확도가 나왔는데, 특히 감량률, 감량 체중 기준 모두에서 RF를 사용하였을 경우 90%의 결과 값이 나왔다. 하위 25% 기준으로는 결과 값이 84% (감량률 기준, DT)에서 87.
60% (감량 체중 기준, DT), 중위 50% 기준으로는 80% (감량률 기준, DT)에서 86% (감량 체중 기준, DT)까지 분포하였다. 3차 분석에서 예측 정확도는 2차 분석과 비교 시 모두 상승되었음을 확인할 수 있었다.
속성 선택기법 사용 후 감량률, 감량 체중 기준으로 1차 예측 분석에서는 22개의 독립 변수 중에서 각각 3개, 8개, 2차 예측 분석에서는 42개의 변수 중에서 각각 12개, 15개, 그리고 3차 예측 분석에서는 66개의 변수 중에서 각각 13개, 16개의 변수가 선택되었다. 1차 분석에서는 감량률, 감량 체중 기준 분석 모두에서 연령, 초기 체중, 다이어트 경험 3개월 이상이 중요한 변수로 선택되었으며, 2차 분석에서는 1차 처방 복용 후 2차 처방 시점까지의 감량률과 감량 체중 등이 높은 순위를 차지 하였으며, 약을 복용하면서 추가로 획득된 변수인 감량 만족도와 식욕억제 및 포만감에 대한 변수 또한 중요 변수로 선택 되었음을 확인할 수 있었다. 3차 분석에서 순위가 높은 변수로 선택된 것은 1차 처방 시점에서 3차 처방 시점까지의 감량률, 감량 체중으로 나타났으며, 나머지 선택된 변수들을 살펴보면 감량 결과로 얻게 되는 체중 정보와 관련된 변수들이 대부분임을 확인할 수 있었다.
1차 분석에서는 감량률, 감량 체중 기준 분석 모두에서 연령, 초기 체중, 다이어트 경험 3개월 이상이 중요한 변수로 선택되었으며, 2차 분석에서는 1차 처방 복용 후 2차 처방 시점까지의 감량률과 감량 체중 등이 높은 순위를 차지 하였으며, 약을 복용하면서 추가로 획득된 변수인 감량 만족도와 식욕억제 및 포만감에 대한 변수 또한 중요 변수로 선택 되었음을 확인할 수 있었다. 3차 분석에서 순위가 높은 변수로 선택된 것은 1차 처방 시점에서 3차 처방 시점까지의 감량률, 감량 체중으로 나타났으며, 나머지 선택된 변수들을 살펴보면 감량 결과로 얻게 되는 체중 정보와 관련된 변수들이 대부분임을 확인할 수 있었다.
이 과정에서 변수가 하나씩 추가될 때 마다 반복적인 학습을 되풀이하게 되는데,이 때 발생하는 모델 학습 소요 시간을 합리적으로 단축하기 분산팽창지수 (Variance Inflation factor, VIF)를 확인하여 값이 10이 넘는 변수들 중 중요도가 낮은 변수들부터 차례로 제거하여 모든 변수들의 VIF가 10이 넘지 않도록 했다. 그 결과 감량률, 감량 체중 기준으로 1차 예측 분석에서는 각각 3개 중에 3개, 8개 중에 7개의 변수가, 2차 예측 분석에서는 각각 12개 중에 6개, 15개 중에 8개의 변수가, 그리고 3차 예측 분석에서는 각각 13개 중에 4개, 16개의 중에 4개의 변수가 남았다. 중요도 순위가 낮은 변수들부터 순위가 높은 변수들을 차례로 하나씩 추가하면서 5-fold cross validation으로 모델 성능을 확인한 결과 큰 폭으로 정확도 (accuracy)가 하락하는 경우 없이 대부분 순차적으로 정확도가 증가하는 것을 볼 수 있었으며, 감량률 기준으로는 ANN이 1차 (54.
그 결과 감량률, 감량 체중 기준으로 1차 예측 분석에서는 각각 3개 중에 3개, 8개 중에 7개의 변수가, 2차 예측 분석에서는 각각 12개 중에 6개, 15개 중에 8개의 변수가, 그리고 3차 예측 분석에서는 각각 13개 중에 4개, 16개의 중에 4개의 변수가 남았다. 중요도 순위가 낮은 변수들부터 순위가 높은 변수들을 차례로 하나씩 추가하면서 5-fold cross validation으로 모델 성능을 확인한 결과 큰 폭으로 정확도 (accuracy)가 하락하는 경우 없이 대부분 순차적으로 정확도가 증가하는 것을 볼 수 있었으며, 감량률 기준으로는 ANN이 1차 (54.69%), 2차 (73.52%), 3차 (81.88%) 예측 분석 모두에서 가장 높은 결과 값을 보였다. 변수를 선택해서 진행한 3차 예측 분석에서 감량률 기준으로는 RF (81.
88%) 예측 분석 모두에서 가장 높은 결과 값을 보였다. 변수를 선택해서 진행한 3차 예측 분석에서 감량률 기준으로는 RF (81.20%), LR (81.60%), ANN (81.88%) 모델에서와 감량 체중 기준으로 LR (82.00%), ANN(83.67%) 모델에서, 변수를 선택하지 않고 모든 변수를 넣고 돌린 분류 기준점 체중 감량 4분위 중 중위 50%의 3차 예측 분석 결과와 비교해 봤을 때, 변수 선택 및 VIF를 사용하여 변수를 줄이고 돌린 정확도가 오히려 상대적으로 더 낮게 나온 것을 확인할 수 있었다(Table 4).
시각화를 통해 모델 성능 변화를 한눈에 파악하기 위한 목적으로 체중 감량 중위 50% 분류 기준점에서 변수 선택 후 진행한 분석에서는 ROC 커브를 통해 나오는 AUC의 값을 확인하여 추가적으로 모델성능을 비교하였으며, 각 차수의 예측 분석에서 모델별로 민감도, 특이도, AUC 값을 획득하였다(Table 5). 감량 체중 기준으로 RF에서 1차 (0.640), 2차 (0.816), 3차 (0.939) 예측 분석 모두 가장 좋은 결과 값을 보였다. 1~3차 예측 분석의 모든 모델을 통틀어 3차 예측분석, 감량 체중 기준으로 RF로 분석을 진행했을 경우 민감도 (0.
939) 예측 분석 모두 가장 좋은 결과 값을 보였다. 1~3차 예측 분석의 모든 모델을 통틀어 3차 예측분석, 감량 체중 기준으로 RF로 분석을 진행했을 경우 민감도 (0.873), 특이도 (0.848), AUC (0.939)가 가장 높게 나왔다. 각 분석 차수별로 가장 높은 AUC 값을 가진 ROC 커브들을 감량률, 감량 체중 기준으로 시각화 하였으며, 차수가 지날수록 AUC 값이 개선됨을 한 눈에 확인할 수 있었다.
939)가 가장 높게 나왔다. 각 분석 차수별로 가장 높은 AUC 값을 가진 ROC 커브들을 감량률, 감량 체중 기준으로 시각화 하였으며, 차수가 지날수록 AUC 값이 개선됨을 한 눈에 확인할 수 있었다. ROC 커브는 AUC의 값에 따라 0.
각 분석 차수별로 가장 높은 AUC 값을 가진 ROC 커브들을 감량률, 감량 체중 기준으로 시각화 하였으며, 차수가 지날수록 AUC 값이 개선됨을 한 눈에 확인할 수 있었다. ROC 커브는 AUC의 값에 따라 0.90 - 1.00는 excellent,0.80 - 0.90는 good, 0.70 - 0.80는 fair, 0.60 - 0.70는 poor, 0.50 - 0.60는 fail로 해석하는데, 3차 예측 분석에서 감량률 기준으로는 가장 높은 AUC값이 0.90 (LR), 감량 체중 기준으로는 0.94 (RF)로 모두 excellent 범주에 들었다(Figure 4).
체중 감량 시도 후 3-6개월34) 혹은 5개월22)때 초기 체중의 5% 이상 체중 감량을 감량 성공 기준으로 본 연구도 있는가 하면, 다수의 연구는 12개월 동안 5% 감량을 성공 기준으로 보고 있었다9,10,13). 본원 비만 프로그램을 이용한 환자들의 약 1달 뒤 평균 감량률은 3.77%, 약 2달 뒤 평균 감량률은 6.54 %로 평균 감량률이 2달 이내에 벌써 초기 체중의 5%를 뛰어 넘기 때문에 체중 감량의 성공 기준을 초기 체중의 5% 감량으로 설정하는 것은 임상 적용 시 활용도가 떨어진다는 판단 하에, 분류의 기준점 (classification benchmark) 설정을 위해 다양한 고찰과 시도를 통해 최종기준을 설정하였다.
모집단 내에서 중위 50%에 해당하는 감량률, 감량 체중을 추가 분석을 위한 분류의 기준점으로 선택한 이유는 본원 비만 프로그램 시행 시 예상되는 중등도 감량 정도 보다 양호하게 감량이 될 지, 저조하게 감량이 될 지를 제시할 수 있으면서도, 상대적으로 다른 차수에 비해 예측이 어려울 수밖에 없는 1차 예측 분석에서 다른 기준 값들 (그룹 내 상하위 25%)보다 추가적인 설명력이 있었기 때문이다. 1차 예측분석 결과를 살펴보면, 종속변수를 중위 50% 감량률, 감량 체중을 기준으로 하여 분석할 경우 예측 정확도 (accuracy) 수치 자체는 다른 결과 값들 보다 낮아 보인다. 그러나, 종속변수를 상위 25%, 하위 25%로 설정할 경우 컴퓨터가 학습 (training) 후 테스트 (test) 과정에서 한 가지 정답만 똑같이 계속 고르더라도 나올 수 있는 정확도인 75%에 가까운 값들이 대부분이었다.
속성 선택 기법 시행 후 1차 예측 분석에서 체중 감량 기준으로는 더 많은 변수들이 선택되었으며 변수들이 추가될 때 마다 설명력이 높아지게 되고 정확도는 상승하여 감량률 기준으로 분석했을 때보다 결과 값이 상대적으로 높게 나왔다. 하지만 1차 예측분석의 전체적인 정확도는 54.
속성 선택 기법 시행 후 1차 예측 분석에서 체중 감량 기준으로는 더 많은 변수들이 선택되었으며 변수들이 추가될 때 마다 설명력이 높아지게 되고 정확도는 상승하여 감량률 기준으로 분석했을 때보다 결과 값이 상대적으로 높게 나왔다. 하지만 1차 예측분석의 전체적인 정확도는 54.05% (감량률 기준,RF)부터 60.06% (감량 체중 기준, RF)까지로 높지 않았으며, AUC 기준으로도 0.550 (감량률 기준,ANN)에서 0.640 (감량 체중 기준, RF)까지 나와 fail에서 poor 범주에 속했다. 체중 감량에 영향을 주는 인자들에 대하여 고찰한 선행연구를 살펴보면 1차 예측 분석에서 속성 선택 기법을 통해 선택된 변수들인 초기비만도, 성별, 연령, 다이어트 경험 등은 모두 그 영향에 있어서 방향성이 일관되지 않은 부분이 있는 인자들이며 상충된 연구 결과들이 존재한다24).
2차 예측 분석부터는 다이어트를 진행하면서 얻을 수 있는 변수들이 추가되었으며 1-2차 처방 시점 사이의 체중 감량률, 감량만족도, 식욕억제 및 포만감 등이 중요 변수로 선택되었다. 감량만족도가 좋은 경우가 변수로 추가되면서 정확도가 1차 예측 분석 결과를 넘어섰으며, 최종적으로 변수 중요도가 가장 높은 1-2차 처방 시점 사이의 체중 감량률 변수가 추가되면서 감량률 기준, 감량 체중 기준 모두에서 예측정확도가 상당한 비율로 상승하는 것을 확인할 수 있었다. 선행연구5,9,10,24)에 따르면 초기 체중 감량(initial weight loss)은 상충되지 않고 일관되게 체중감량을 예측할 수 있는 중요 인자로 거론되고 있으며, 이러한 강력한 입력(독립)변수가 추가됨에 따라 2차 예측 분석의 정확도가 상승한 것으로 생각된다.
따라서, 체중 감소가 양호하게 진행되고 있는 사람 또한 반응급감현상 때문에 식욕억제 정도가 줄어들면서 의식적인 식사 조절이 증가하고 이로 인한 만족도가 줄어들 수 있는데, 이런 경우 실제 체중 감량 정도와 식욕억제나 감량만족도 변수와는 일치되지 않는 결과를 보일 수 있어 3차 예측 분석에서는 중요 변수로 선택되지 않았을 가능성을 고려해볼 수 있다. 2차 예측 분석과 유사하게 3차 예측 분석에서도 가장 중요한 변수는 1-3차 처방 시점 사이의 체중 감량률과 감량 체중이 선택되었으며, 이와 더불어 1-2차, 2-3차 사이의 부분적인 감량률과 감량 체중도 중요 변수로 선택되었다(Table 4). 체중 감량의 궤적(trajectories)은 개인마다 차이가 있을 수 있는데, 분석 직전까지의 체중 감량과 더불어 그 사이의 부분적인 감량 정도가 추가적인 변수로 모두 들어가 있어 향후 변화에 대한 예측이 더 용이 해졌을 가능성을 생각해 볼 수 있으며, 이에 따라 3차 예측 분석의 정확도는 2차에 비하여 상승한 것으로 생각된다.
첫째, 분석에 사용된 변수 이외에도 사회경제적 요인 및 복약 순응도 등 많은 변수가 체중 감소에 영향을 미칠 수 있는데, EHR data의 한계상 진료 차트에서 추출될 수 있는 정보만 사용 가능하다는 점 때문에 현재 가지고 있는 정보만으로 분석이 시행된 점이다. 특히, 복약 순응도는 선행연구에서 중요한 비만 치료 영향 인자로 나타났으나34) 본 연구에서는 정보 획득의 어려움으로 이를 변수로 사용되지 못하였는데, 향후 차트 개선을 통해 이러한 정보를 추가하여 모델을 개선해 나간다면 예측도 상승에 기여할수 있을 것으로 기대된다.
둘째, 기존 선행연구들의 회귀 모델을 통한 예측과 마찬가지로 본 연구의 예측 분석 모델 또한 이 분석 그룹 안에서만 유용하다는 점이다. 따라서, 다른 비만 프로그램을 적용하고 있는 환자들에게 이 분석모델을 바로 적용하기 어려우며, 분석 방법을 응용하여 적용하려고 하더라도 머신러닝 기법에 능숙한 분석 전문가가 없으면 임상 현장에서 쉽게 만들어서 적용하기 어렵다는 점이다.
넷째, 본 연구에서 분석에 사용된 알고리즘 중에서 독보적으로 뛰어난 성능을 나타낸 것은 없었으나 일관되게 비교적 높은 예측 결과 값을 나타낸 것을 살펴보면, 체중 감량 중위 50% 기준으로 속성 선택기법 사용 후 감량률 기준으로 봤을 때 1, 2, 3 차 예측 분석 모두에서 ANN의 정확도가 가장 높았으며(Table 4), 감량 체중 기준으로는 1, 2, 3차 예측 분석 모두에서 RF의 AUC 값이 가장 높았다(Table 5).그러나 ANN과 RF 모두 블랙 박스 알고리즘으로 그 내부를 들여다볼 수가 없어 해석이 어렵다는 한계점을 가지고 있다27,37).
체중 감량의 예측은 가미태음조위탕을 복용한 모집단의 감량률과 감량 체중의 4분위인 상위 25%, 중위 50%, 하위 25%를 분류의 기준점 (classification bench mark)으로 삼았으며, 각 기준점을 넘을 것인가를 맞추는 예측을 시행하여 정확도 (accuracy)를 5-fold cross validation으로 구하여 비교 분석하였다. 이 분석을 통하여, 체중 감량 중위 50%를 분류의 기준점으로 삼았을 때가 상하위 25%를 분류의 기준점으로 삼았을 때 보다 모델의 설명력이 더 좋음을 확인할 수 있었다. 그리고, 1차 (55.
이 분석을 통하여, 체중 감량 중위 50%를 분류의 기준점으로 삼았을 때가 상하위 25%를 분류의 기준점으로 삼았을 때 보다 모델의 설명력이 더 좋음을 확인할 수 있었다. 그리고, 1차 (55.01%, 감량률 50%기준 ANN /60.18%, 감량 체중 50% 기준 RF)에서 2차 (73.59%, 감량률 50%기준 ANN /75.79%, 감량 체중 50% 기준 ANN), 3차(84.80%, 감량률 50%기준 RF /86.00%, 감량 체중 50%기준 DT) 예측 분석으로 갈수록 정확도가 상승하는 것을 확인할 수 있었다.
2. 체중 감량 중위 50%를 분류 기준으로 변수 선택 후 변수 중요도를 확인하여 추가 예측 분석을 시행한 결과, 감량률 기준으로 ANN의 정확도가 1차 (54.69%), 2차 (73.52%), 3차 (81.88%) 예측 분석 모두에서 가장 높게 나왔다. AUC를 통해 추가적으로 예측 성능 확인을 진행 하였으며 감량 체중 기준으로 RF의 AUC가 1차 (0.
88%) 예측 분석 모두에서 가장 높게 나왔다. AUC를 통해 추가적으로 예측 성능 확인을 진행 하였으며 감량 체중 기준으로 RF의 AUC가 1차 (0.640), 2차(0.816), 3차 (0.939) 예측 분석 모두에서 가장 높았다.
후속연구
선행연구에서 알려진 체중 감량에 영향을 미치는 요인들을 바탕으로 자료를 분석, 정리하여 기존 데이터로부터 특정 값을 예측하는 능력이 뛰어난 머신러닝 기법을 사용하여 체중 감량이 양호하게 이루어질 것인지 아닌지를 판별할 수 있는 예측 모델을 만든다면 임상에서 비만환자들을 진료함에 있어서 초진에서부터 더욱 적절한 조언을 할 수 있고 관리의 강도를 조절해 나가 성공적인 치료 결과를 얻는데 도움을 줄 수 있을 것으로 사료된다.
첫째, 분석에 사용된 변수 이외에도 사회경제적 요인 및 복약 순응도 등 많은 변수가 체중 감소에 영향을 미칠 수 있는데, EHR data의 한계상 진료 차트에서 추출될 수 있는 정보만 사용 가능하다는 점 때문에 현재 가지고 있는 정보만으로 분석이 시행된 점이다. 특히, 복약 순응도는 선행연구에서 중요한 비만 치료 영향 인자로 나타났으나34) 본 연구에서는 정보 획득의 어려움으로 이를 변수로 사용되지 못하였는데, 향후 차트 개선을 통해 이러한 정보를 추가하여 모델을 개선해 나간다면 예측도 상승에 기여할수 있을 것으로 기대된다.
본 연구 또한 이분형 분류를 통한 예측을 진행하였기 때문에 이러한 문제에서 자유로울 수는 없다. 다만, 본 연구는 단순 이분형 분류 외에 체중 감량 4분위 감량 기준을 통해 예측 분석 그룹 내에서 다이어트를 진행하면 환자 본인이 어떤 분위 내에 위치할 수 있을지 가늠할 수 있는 분석이 가능하여, 그룹 내에서 평균적인 감량보다 양호할 지 저조할 지 보다 세부적인 분석을 원하는 환자에게 추가적인 예측을 제공할 수 있어 그 결과에 따라 좀 더세분화된 감량 목표 설정 및 중재를 위한 정보를 획득할 수 있겠다.
예를 들어, 연령이 중요 변수로 선택되었다고 하더라도 나이가 어릴수록 감량이 잘 되는지, 나이가 많을수록 감량이 잘 되는지에 대한 부분은 여전히 알 수 없는 상태로 남아있게 된다. 추후 체중 감량에 영향을 미치는 변수들에 대한 구체적인 분석을 위해서 LR에서 표준화 회귀계수를 구하여 변수의 음양 방향성을 살펴보거나 분류가 아닌 회귀의 형태로 머신러닝을 진행하여 회귀계수를 살펴보는 방법을 통해 변수들의 영향력의 크기나 방향성에 대하여 분석해보는 추가적인 연구가 필요할 것으로 생각된다.
끝으로, 향후 머신러닝 기법을 적용한 이상 반응 및 중도 탈락 예측 연구를 진행한다면 종합적인 비만 관리 프로그램을 만드는 데 도움을 줄 수 있을 것으로 생각된다. 본 연구에서 초기에는 체중 감량 예측이 어려운 부분을 확인할 수 있었는데, 초진 시에는 예측의 주안점을 향후 발생할 수 있는 이상 반응 예측에 둔다면 약의 용량을 조절해서 선제적 대응을 할 수 있어 중도 탈락을 줄이고 체중 감량 프로그램을 완수하는데 도움을 줄 수 있을 것이다.
끝으로, 향후 머신러닝 기법을 적용한 이상 반응 및 중도 탈락 예측 연구를 진행한다면 종합적인 비만 관리 프로그램을 만드는 데 도움을 줄 수 있을 것으로 생각된다. 본 연구에서 초기에는 체중 감량 예측이 어려운 부분을 확인할 수 있었는데, 초진 시에는 예측의 주안점을 향후 발생할 수 있는 이상 반응 예측에 둔다면 약의 용량을 조절해서 선제적 대응을 할 수 있어 중도 탈락을 줄이고 체중 감량 프로그램을 완수하는데 도움을 줄 수 있을 것이다. 뿐만 아니라, 스마트 기기를 통하여 내원을 하지 않더라도 다빈도로 환자의 식이, 운동 정보들을 축적하여 체중 감량 예측의 정확도를 업그레이드해 나간다면 통합 비만 관리에 한 걸음 더 다가설 수 있을 것으로 생각된다.
본 연구에서 초기에는 체중 감량 예측이 어려운 부분을 확인할 수 있었는데, 초진 시에는 예측의 주안점을 향후 발생할 수 있는 이상 반응 예측에 둔다면 약의 용량을 조절해서 선제적 대응을 할 수 있어 중도 탈락을 줄이고 체중 감량 프로그램을 완수하는데 도움을 줄 수 있을 것이다. 뿐만 아니라, 스마트 기기를 통하여 내원을 하지 않더라도 다빈도로 환자의 식이, 운동 정보들을 축적하여 체중 감량 예측의 정확도를 업그레이드해 나간다면 통합 비만 관리에 한 걸음 더 다가설 수 있을 것으로 생각된다.
머신러닝 기법을 적용한 체중 감량 예측은 초기 체중 감량 정보를 활용하여 정확도가 개선됨을 확인할 수 있었으며, 향후 임상에서 본 연구 결과는 가미태음조위탕에 반응하지 않거나 예측되는 체중 감량치가 낮은 환자들을 선별하여 선제적 중재를 실시하는데 활용할 수 있을 것으로 생각된다.
질의응답
핵심어
질문
논문에서 추출한 답변
비만은 어떤 병의 원인이 되는가?
비만은 에너지 섭취량이 소비량보다 많아서 오는 에너지 불균형 상태가 오랫동안 지속됨으로써 발생하는 질환으로1) 전세계적으로 유병률이 증가하고 있다2). 비만은 심혈관질환, 당뇨병, 골관절염 등의 발병을 높일 뿐만 아니라 일부 암의 위험을 증가시키는 것으로 알려져 있어3,4), 비만인의 체중 감량은 건강을 위해 중요하게 인식되어져 왔다.
비만이란 무엇인가?
비만은 에너지 섭취량이 소비량보다 많아서 오는 에너지 불균형 상태가 오랫동안 지속됨으로써 발생하는 질환으로1) 전세계적으로 유병률이 증가하고 있다2). 비만은 심혈관질환, 당뇨병, 골관절염 등의 발병을 높일 뿐만 아니라 일부 암의 위험을 증가시키는 것으로 알려져 있어3,4), 비만인의 체중 감량은 건강을 위해 중요하게 인식되어져 왔다.
머신러닝의 장점은 무엇인가?
머신러닝 (Machine learning)은 ‘데이터를 수집, 정제, 처리, 분석하고 그로부터 유용한 통찰력을 얻어내는 연구’ 혹은 ‘설명력 있고, 예측 가능한 모델링을 할 뿐만 아니라 통찰력 있고, 흥미롭고, 참신한 패턴을 발견하는 과정’으로, 머신러닝이 기존 전통적인 접근법과 가장 다른 점은 규칙을 프로그래밍 해서 진행되는 것이 아니라 다양한 예시들로 학습을 한다는 점에 있다. 기존 데이터를 통해 높은 적합도로 학습, 훈련이 이루어지면 새로운 데이터가 입력되었을 경우 이를 바탕으로 예측이 가능하게 되고, 입력된 새 데이터로 재학습을 하여 모델의 정확도를 더욱 성장시킬 수 있는 장점을 가지고 있다14,15).
참고문헌 (37)
Hill JO, Wyatt HR, Peters JC. Energy balance and obesity. Circulation. 2012;126(1):126-32.
Wall KC, Politzer CS, Chahla J, Garrigues GE. Obesity is associated with an increased prevalence of glenohumeral osteoarthritis and arthroplasty: A cohort study. Orthop Clin N Am. 2020;51(2):259-264.
Handjieva-Darlenska T, Handjiev S, Larsen TM, Baak MA, Jebb S, Papadaki A, et al. Initial weight loss on an 800-kcal diet as a predictor of weight loss success after 8 weeks: the Diogenes study. Eur J Clin Nutr. 2010;64(9):994-9.
Hollis JF, Gullion CM, Stevens VJ, Brantley PJ, Appel LJ, Ard JD, et al. Weight loss during the intensive intervention phase of the weight-loss maintenance trial. Am J Prev Med. 2008;35(2):118-26.
Annesi JJ, Whitaker AC, Psychological factors discriminating between successful and unsuccessful weight loss in a behavioral exercise and nutrition education treatment. Int J Behav Med. 2010;17(3):168-75.
Fabricatore AN, Wadden TA, Moore RH, Butryn ML, Heymsfield SB, Nguyen AM. Predictors of attrition and weight loss success: Results from a randomized controlled trial. Behav Res Ther. 2009; 47(8):685-91.
Hadziabdic MO, Mucalo I, Hrabac P, Matic T, Rahelic D, Bozikov V. Factors predictive of drop-out and weight loss success in weight management of obese patients. J Hum Nutr Diet. 2015;28(2):24-32.
Batterham M, Tapsell LC, Charlton KE. Predicting dropout in dietary weight loss trials using demographic and early weight change characteristics: Implications for trial design. Obes Res Clin Pract. 2016;10(2):189-96.
Batterham M, Tapsell L, Charlton K, O'Shea J, Thorne R. Using data mining to predict success in a weight loss trial. J Hum Nutr Diet. 2017;30(4):471-478.
Kim H, Yang SB, Kang Y, Park YB, Kim JH. Machine learning approach to blood stasis pattern identification based on self-reported symptoms. Korean J Acupunct. 2016;33(3):102-113.
Wu CC, Hsu WD, Islam MM, Poly TN, Yang HC, Nguyen PA, et al. An artificial intelligence approach to early predict non-ST-elevation myocardial infarction patients with chest pain. Comput Methods Programs Biomed. 2019;173:109-117.
Dugan TM, Mukhopadhyay S, Carroll A, Downs S. Machine Learning Techniques for Prediction of Early Childhood Obesity. Appl Clin Inform. 2015;6(3):506-520.
Hammond R, Athanasiadou R, Curado S, Aphinyanaphongs Y, Abrams C, Messito MJ, et al. Predicting childhood obesity using electronic health records and publicly available data. PLoS ONE 14(4): e0215571. https://doi.org/10.1371/journal.pone.0215571
Kim YM, Cho DG, Kang SH. Analysis of Factors associated with Geographic Variations in the Prevalence of Adult Obesity using Decision Tree. Health Soc Sci. 2014;36(1):157-181.
Nam SH, Kim SY, Lim YW, Park YB. Review on predictors of weight loss in obesity treatment. J Korean Med Obes Res. 2018;18(2):115-127.
Yoon NR, Yoo YJ, Kim MJ, Kim SY, Lim YW, Lim HH, et al. Analysis of adverse events in weight loss program in combination with 'Gamitaeeumjowee-Tang' and low-calorie diet. J Korean Med Obes Res. 2018;18(1):1-9.
Kurs MB, Rudnicki WR. Feature Selection with the Boruta Package. J Stat Softw, 2010;36(11):1-13.
Jung D, Kim G, Park J, Lee H, Kim H, Choi H, et al. Prediction of rehospitalization of patients and finding causes of it with data mashup and bigdata analysis. Entrue J Inf Technol. 2015;14(3):133-149.
Diaz-Uriarte R, Andres SA. Gene selection and classification of microarray data using random forest. BMC Bioinformatics. 2006;7:3. https://doi.org/10.1186/1471-2105-7-3
Ortega Hinojosa AM, MacLeod KE, Balmes J, Jerrett M. Influence of school environments on childhood obesity in California. Environ Res. 2018;166:100-107.
Munger E, Choi H, Dey AK, Elnabawi YA, Groenendyk JW, Rodante J, et al., Application of machine learning to determine top predictors of noncalcified coronary burden in psoriasis: An observational cohort study". J Am Acad Dermatol. 2019. Article in press. https://doi.org/10.1016/j.jaad.2019.10.060
Scheinker D, Valencia A, Rodriguez F. Identification of factors associated with variation in US county-level obesity prevalence rates using epidemiologic vs machine learning models. JAMA Netw Open. 2019;2(4):e192884.
Forman EM, Kerrigan SG, Butryn ML, Juarascio AS, Manasse SM, Ontanon S, et al. Can the artificial intelligence technique of reinforcement learning use continuously-monitored digital data to optimize treatment for weight loss? J Behav Med. 2019;42(2):276-290.
Hong N, Wen A, Stone DJ, Tsuji S, Kingsbury PR, Rasmussen LV, et al. Developing a FHIR-based EHR phenotyping framework: A case study for identification of patients with obesity and multiple comorbidities from discharge summaries. J Biomed Inform. 2019;99:103310 https://doi.org/10.1016/j.jbi.2019.103310
Han JY, Park YJ. Analysis of factors influencing obesity treatment according to initial condition and compliance with medication. J Korean Med Obes Res. 2019;19(1):31-41.
Magkos F, Fraterrigo G, Yoshino J, Luecking C, Kirbach K, Kelly SC. Effects of Moderate and Subsequent Progressive Weight Loss on Metabolic Function and Adipose Tissue Biology in Humans with Obesity. Cell Metab, 2016;23(4):591-601.
Jo GW, Ok JM, Kim SY, Lim YW. Review on the Efficacy and Safety of Mahuang and Ephedrine in the Treatment of Obesity-Focused on RCT-. J Korean Med. 2017;38(3):170-184.
Disse E, Ledoux S, Betry C, Caussy C, Maitrepierre C, Coupaye M, et al. An artificial neural network to predict resting energy expenditure in obesity. Clin Nutr. 2018;37(5):1661-1669.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.