특징집합 IG-MLP 평가 기반의 최적화된 특징선택 방법을 이용한 질환 예측 머신러닝 모델 Optimized Feature Selection using Feature Subset IG-MLP Evaluation based Machine Learning Model for Disease Prediction원문보기
암을 제외한 한국인의 가장 높은 사망원인은 심뇌혈관질환으로 사망원인의 24%를 차지한다. 현재 국내 환자의 심혈관질환의 위험도 산출은 프레밍험 위험지수를 기반으로 하지만, 국외의 가이드라인에 의존하고 있어 정확도가 떨어지는 편이며, 뇌혈관질환의 예측에 대한 위험도는 산출할 수 없다. 심뇌혈관질환은 예방을 위한 조기증상들의 특징 분석이 어려워 질환예측이 힘들며, 한국인에 적합한 예측 방법이 필요하다. 본 연구의 목적은 심뇌혈관질환 데이터를 이용하여, 특징집합 IG-MLP 평가 기반의 특징선택 방법론을 시뮬레이션 하여 검증하는 것이다. 제안하는 방법은 제4~7기 국민건강영양조사 원시자료를 이용한다. 심뇌혈관질환의 예측에 중요한 특징들을 선별하기 위해, 속성들의 심뇌혈관질환에 대한 정보이득-다층신경망을 이용한 분석을 실시하며, 최종적으로 선별된 특징을 이용한 심뇌혈관질환 예측 모델을 제공한다. 제안하는 방법으로 한국인의 심뇌혈관질환에 관련된 중요한 특징들을 찾을 수 있으며, 최적화된 특징들로 구성된 예측 모델은 한국인에 대해 더욱 정확한 심뇌혈관 예측을 할 수 있다.
암을 제외한 한국인의 가장 높은 사망원인은 심뇌혈관질환으로 사망원인의 24%를 차지한다. 현재 국내 환자의 심혈관질환의 위험도 산출은 프레밍험 위험지수를 기반으로 하지만, 국외의 가이드라인에 의존하고 있어 정확도가 떨어지는 편이며, 뇌혈관질환의 예측에 대한 위험도는 산출할 수 없다. 심뇌혈관질환은 예방을 위한 조기증상들의 특징 분석이 어려워 질환예측이 힘들며, 한국인에 적합한 예측 방법이 필요하다. 본 연구의 목적은 심뇌혈관질환 데이터를 이용하여, 특징집합 IG-MLP 평가 기반의 특징선택 방법론을 시뮬레이션 하여 검증하는 것이다. 제안하는 방법은 제4~7기 국민건강영양조사 원시자료를 이용한다. 심뇌혈관질환의 예측에 중요한 특징들을 선별하기 위해, 속성들의 심뇌혈관질환에 대한 정보이득-다층신경망을 이용한 분석을 실시하며, 최종적으로 선별된 특징을 이용한 심뇌혈관질환 예측 모델을 제공한다. 제안하는 방법으로 한국인의 심뇌혈관질환에 관련된 중요한 특징들을 찾을 수 있으며, 최적화된 특징들로 구성된 예측 모델은 한국인에 대해 더욱 정확한 심뇌혈관 예측을 할 수 있다.
Cardio-cerebrovascular diseases (CCD) account for 24% of the causes of death to Koreans and its proportion is the highest except cancer. Currently, the risk of the cardiovascular disease for domestic patients is based on the Framingham risk score (FRS), but accuracy tends to decrease because it is a...
Cardio-cerebrovascular diseases (CCD) account for 24% of the causes of death to Koreans and its proportion is the highest except cancer. Currently, the risk of the cardiovascular disease for domestic patients is based on the Framingham risk score (FRS), but accuracy tends to decrease because it is a foreign guideline. Also, it can't score the risk of cerebrovascular disease. CCD is hard to predict, because it is difficult to analyze the features of early symptoms for prevention. Therefore, proper prediction method for Koreans is needed. The purpose of this paper is validating IG-MLP (Information Gain - Multilayer Perceptron) evaluation based feature selection method using CCD data with simulation. The proposed method uses the raw data of the 4th ~ 7th of The Korea National Health and Nutrition Examination Survey (KNHANES). To select the important feature of CCD, analysis on the attributes using IG-MLP are processed, finally CCD prediction ANN model using optimize feature set is provided. Proposed method can find important features of CCD prediction of Koreans, and ANN model could predict more accurate CCD for Koreans.
Cardio-cerebrovascular diseases (CCD) account for 24% of the causes of death to Koreans and its proportion is the highest except cancer. Currently, the risk of the cardiovascular disease for domestic patients is based on the Framingham risk score (FRS), but accuracy tends to decrease because it is a foreign guideline. Also, it can't score the risk of cerebrovascular disease. CCD is hard to predict, because it is difficult to analyze the features of early symptoms for prevention. Therefore, proper prediction method for Koreans is needed. The purpose of this paper is validating IG-MLP (Information Gain - Multilayer Perceptron) evaluation based feature selection method using CCD data with simulation. The proposed method uses the raw data of the 4th ~ 7th of The Korea National Health and Nutrition Examination Survey (KNHANES). To select the important feature of CCD, analysis on the attributes using IG-MLP are processed, finally CCD prediction ANN model using optimize feature set is provided. Proposed method can find important features of CCD prediction of Koreans, and ANN model could predict more accurate CCD for Koreans.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서, 데이터 전처리의 주요 목적은 국민건강영양조사 통합 데이터 셋을 심뇌혈관질환 예측 모델의 입력으로 사용할 수 있도록 구성하는 것이다. 데이터 전처리 단계는 데이터 정제(Data cleansing), 데이터 대체(Data imputation), 특징선택(Feature selection) 등으로 이뤄져있다.
본 연구의 목적은 IG-MLP 특징선택 방법을 심뇌혈관 질환 데이터를 이용하여 검증하는 것에 있으며, 검증을 위해 인공신경망을 이용한 심뇌혈관질환 예측 모델에 중요한 특징들을 정보이득(Information gain, IG)–다층신 경망(Multilayer perceptron, MLP) 학습 기반 특징선택 방법 통해 선택한다.
제안 방법
Hot deck 대체를 위해 f-검정과 t-검정으로 대체를 위한 기증(donor) 데이터를 검증하고, 결측값을 기증값으로 대체한다. 검정 결과는 Table 3과 같다.
목적 모델과 동일한 분류기를 사용하는 특징선택 방법은 성능이 좋다고 알려져 있으나, 속성 개수에 따라 연산이 지수적으로 증가하여 효율이 떨어진다. 그러므로 본 논문에서는 IG 분석을 통한 특징부분집합의 최초 원소의 선택 후, MLP 기반 특징 선택을 진행한다.
데이터 셋 중, 심뇌혈관질환 클래스 값이 참인 데이터에서, 하나의 레코드에 여러 결측값이 있는 경우에는 레코드를 삭제(list wise deletion)처리 하였고, 클래스 값이 거짓인 데이터 셋에서는 결측 값이 없는 레코드만을 추출하였다.
데이터 셋을 연구에 이용하기 위해, 연도별 원시자료를 통합한 뒤에, 데이터 전처리, 데이터 샘플링을 진행하였다. 최종적으로 선택된 데이터 셋은 총 9252개의 레코드로 이뤄져 있으며, 실험을 위해 트레이닝 셋은 6478개(70%)의 레코드로, 테스트 셋은 2774개(30%)의 레코드로 구성된다.
통합된 데이터 셋에서 심뇌혈관질환 유병여부에 대해 참값을 포함한 레코드 수는 총 2910개로, 비유병자와의 데이터 균형이 맞지 않는다. 따라서 심뇌혈관질환의 유무에 따라 데이터 셋을 나눈 후, 나눠진 데이터 셋에 대해 데이터 정제와 대체 작업을 진행하고, 추출된 데이터 셋의 통합 이후에 특징선택을 진행한다. 데이터의 전처리 과정은 Fig.
실험을 위해, 우리나라의 보건복지부가 작성한 통계인 제4기~제7기 국민건강영양조사 통계 데이터를 이용하였으며, 기존의 특징선택 방법들과 비교했다. 또한 선별된 최적 특징부분집합을 이용한 인공신경망의 분류 모델을 제안하였고, 이를 통해 우리나라에 맞는 심뇌혈관질환의 예측을 위한 효율적인 속성들을 선택했다. 만들어진 모델은 개인의 심뇌혈관질환을 예측, 예방할 수 있다.
본 논문에서는 IG-MLP기반의 최적 특징부분집합 선택 방법을 제안하고 검증을 위해 특징 선택 과정을 시뮬레이션 하였다. 실험을 위해, 우리나라의 보건복지부가 작성한 통계인 제4기~제7기 국민건강영양조사 통계 데이터를 이용하였으며, 기존의 특징선택 방법들과 비교했다.
, 2016). 본 논문에서는 두 방법을 융합하여 분류 모델의 학습과 성능에 효율적인 특징 집합을 선택한다.
본 연구에서는 데이터 셋 중, 심뇌혈관질환의 유병여부가 참값인 레코드들에 대해서만 데이터 대체를 진행하였다. 의료 데이터의 특성상, 특정 질환을 가진 환자의 수가 소수이기 때문에, 일률적 삭제의 방법보다는 데이터를 대체하는 것이 합리적이라 판단하였다.
특징들의 선별을 위해, 먼저 특징들의 클래스에 대한 IG의 계산을 통해 특징들을 필터링한다. 선별된 특징들과 나머지 특징들로 생성된 특징부분집합들을 특징선택을 위한 MLP에 입력하고, 입력된 특징부분집합의 학습, 테스트를 통한 평가 결과의 단계별 시뮬레이션 비교를 통해 최적화된 특징들을 찾아낼 수 있다.
1의 의사코드의 단계를 따른다. 실험을 위해 본 논문에서는 11개의 속성을 가지는 후보 특징집합을 정했고, 다층신경망을 이용한 특징집합의 평가 과정의 계산량을 줄이기 위해, 통계적 분석인 정보이득의 계산을 진행한다. 정보이득 계산을 통해, 선택된 초기 특징들은 다층신경망을 이용한 특징 후보 세트의 평가 과정에 항상 포함되는 특징들이다.
심뇌혈관질환 예측 모델과 독립적인 특징분석을 위해, IG를 계산한다. IG는 엔트로피 계산을 기반으로 이뤄진다.
특징선택 과정에서 선택된 특징부분집합의 빈도수가 낮은 속성들은 10번의 CV 중 최종 특징부분집합에 포함된 비율이 적었다고 해석 가능하며. 이를 기반으로, 빈도가 낮은 속성들을 제거하면서 특징집합의 최적화를 진행한다. 본 연구에서는 검증을 위해, 아래와 같은 측정지표의 계산을 수행한다.
제안하는 방법은 질병관리본부에서 발표하는 국민건강영양조사의 제4기~제7기 원시자료를 이용하며(질병관리본부, 2007-2017), 데이터 셋에서 심뇌혈관질환의 예측에 중요한 특징들을 선별한다. 또한 선별된 특징들로 심뇌혈관질환을 예측하는 인공신경망을 제공한다.
제안하는 방법을 통해 최종적으로 선택된 인공신경망 기반의 심뇌혈관질환 예측 모델을 위한 최적화된 특징부 분집합은 {나이, 고혈압, 당뇨병, 총콜레스테롤, 이상지질 혈증, 흡연여부, BMI, HDL 콜레스테롤}이다.
대상 데이터
본 논문에서는 실험을 위해, 제4기~제7기 국민건강영 양조사 원시자료 데이터 셋을 사용한다. 국민건강영양조사는 대한민국의 보건복지부 산하의 질병관리본부에서 수행되었고, 보건정책의 기초자료로 활용하기 위한 통계이다.
본 논문에서는 IG-MLP기반의 최적 특징부분집합 선택 방법을 제안하고 검증을 위해 특징 선택 과정을 시뮬레이션 하였다. 실험을 위해, 우리나라의 보건복지부가 작성한 통계인 제4기~제7기 국민건강영양조사 통계 데이터를 이용하였으며, 기존의 특징선택 방법들과 비교했다. 또한 선별된 최적 특징부분집합을 이용한 인공신경망의 분류 모델을 제안하였고, 이를 통해 우리나라에 맞는 심뇌혈관질환의 예측을 위한 효율적인 속성들을 선택했다.
심뇌혈관질환 예측 인공신경망 모델은 MLP를 사용한다. 전체 데이터 셋의 70%인 6478개의 트레이닝 데이터로 선택된 특징집합을 사용한 10-fold CV를 통해 학습되 었으며, 평가는 30%의 2774개의 테스트 데이터를 통해 진행된다.
데이터 셋을 연구에 이용하기 위해, 연도별 원시자료를 통합한 뒤에, 데이터 전처리, 데이터 샘플링을 진행하였다. 최종적으로 선택된 데이터 셋은 총 9252개의 레코드로 이뤄져 있으며, 실험을 위해 트레이닝 셋은 6478개(70%)의 레코드로, 테스트 셋은 2774개(30%)의 레코드로 구성된다.
데이터처리
2 이상인 속성들만을 사용하였다. IG는 클래스-속성간의 정보이득 지수를 통해 속성을 선택하였고, CFS는 클래스-특징부분집합의 피어슨 상관계수를 이용한 통계적 계산을 통해 특징을 선택하였다(Hall, 2000).
정보이득 계산을 통해, 선택된 초기 특징들은 다층신경망을 이용한 특징 후보 세트의 평가 과정에 항상 포함되는 특징들이다. 또한 적은 데이터양을 보완하기 위해, 10 fold 교차검증을 진행하며, 각 fold별 검증과정을 통해 선택된 특징 부분집합들의 특징들의 빈도를 계산하여 최종 특징 세트를 결정할 수 있도록 컴퓨터를 이용하여 시뮬레이션 한다.
본 논문에서는 10-fold 교차검증(cross validation, CV)을 통해 최종 특징선택을 진행하였으며, 총 10번의 CV에서 선택된 특징부분집합의 원소의 선택 빈도는 Table 7과 같다. 기본원소로 채택한 age와 hypertension을 제외하고서라도 dyslipidemia, diabetes, total_CHOL의 속성은 10/10 빈도로 선택되었고, 다음으로는 smoke, BMI, HDL _CHOL,이 유의미하게 빈도가 높았으며, SBP와 DBP는 낮은 빈도를 가졌다.
본 연구에서 제안하는 IG-MLP기반 최적 특징선택의 실험결과는 Table 8과 같으며, 각 실험의 성능 평가는 ROC curve의 면적의 크기인 AUROC의 비교를 통해 이뤄진다. AUROC는 \(X_9,X_8\) 의 특징부분집합을 사용하여 학습한 모델이 0.
이론/모형
데이터의 통합 과정에서 심뇌혈관 예측을 위한 속성들의 선택은 기존의 질환 진단 방법인 FRS와 ASCVD의 입력변수를 기반으로 참고하였다. FRS와 ASCVD의 입력변수는 성별, 나이, 수축기혈압, 총콜레스테롤, HDL콜레스테롤, 고혈압여부, 흡연여부, 당뇨병유무 등으로 구성되어 있으며, 그 외에도 심뇌혈관 질환의 중요인자로 판단되는 이상지질혈증여부, 이완기혈압, BMI(Body Mass Index) (김상현, 2016; 김태년, 2015) 등도 포함하였다.
특징부분집합의 생성은 최초 특징부분집합 {age, hypertension}의 확장으로 이뤄진다. 본 논문에서는 추가할 속성의 선택을 위해서 휴리스틱 탐색(Heuristic search)중 하나인 Beam search를 사용한다. 평가를 위한 분류기는 MLP를 이용하며, 생성된 특징부분집합의 평가는 F-score 계산으로 이뤄진다.
를 맞추기 위해 소모해야 하는 정보의 크기라고 해석할 수 있다. 본 연구에서는, 교차 엔트로피 식을, 특징 분석을 위한 IG의 계산에 사용하기 위해 쿨백-라이블러 발산(KullbackLeibler divergence, KLD)로 정리한 식을 사용하였으며(Hall, 2000), 식 (3)과 같다.
심뇌혈관질환 예측 모델의 특징선택을 위해, 특징부분집합의 평가에 MLP를 이용한다. 목적 모델과 동일한 분류기를 사용하는 특징선택 방법은 성능이 좋다고 알려져 있으나, 속성 개수에 따라 연산이 지수적으로 증가하여 효율이 떨어진다.
심뇌혈관질환 예측 인공신경망 모델은 MLP를 사용한다. 전체 데이터 셋의 70%인 6478개의 트레이닝 데이터로 선택된 특징집합을 사용한 10-fold CV를 통해 학습되 었으며, 평가는 30%의 2774개의 테스트 데이터를 통해 진행된다.
성능/효과
AUROC의 비교를 통한 분류기의 성능은 본 논문에서 제시한 IG-MLP기반 특징선택방법을 이용한 모델이 가장 성능이 좋았으며, Sensitivity의 경우는 CFS의 특징들을 이용한 모델의 예측 결과가 0.822로 IG-MLP 방법보다 0.038 정도 높았으나, 그 신뢰도와 특이도가 IG-MLP 보다 각각 0.03, 0.042 낮았다. FRS 또한 Sensitivity가 IG-MLP에 비해 0.
하지만 이상지질혈증 유무에 따른 HDL콜레스테롤 수치의 평균에는 차이가 없었다고 해석할 수 있다. 결과에 따라, SBP, DBP, total_CHOL의 결측 값은 선택된 기증 데이터 셋에서 랜덤대체하고, HDL콜레스테롤과 BMI의 결측 값은 각각의 평균값으로 대체하였다.
이후로는 Table 8과 같이 성능이 떨어짐을 확인할 수 있었다. 결론적으로, \(X_9,X_8\) 의 특징부분집합을 사용하여 학습한 심뇌혈관질환 예측 모델은 거의 성능이 비슷하다고 볼 수 있으나, 더 작은 특징부분집 합으로 비슷한 성능을 낸 \(X_8\) 의 특징부분집합이 더 우수하다고 볼 수 있다.
계산 결과, age와 hypertension 속성이 유의미한 IG 값을 가졌고, 혈압을 나타내는 SBP와 DBP는 IG 값이 차이가 났다. 실제 임상에서도 나이는 심뇌혈관질환의 위험도에 가장 큰 변수로 알려져 있다.
본 논문에서는 10-fold 교차검증(cross validation, CV)을 통해 최종 특징선택을 진행하였으며, 총 10번의 CV에서 선택된 특징부분집합의 원소의 선택 빈도는 Table 7과 같다. 기본원소로 채택한 age와 hypertension을 제외하고서라도 dyslipidemia, diabetes, total_CHOL의 속성은 10/10 빈도로 선택되었고, 다음으로는 smoke, BMI, HDL _CHOL,이 유의미하게 빈도가 높았으며, SBP와 DBP는 낮은 빈도를 가졌다.
LR+는 양성 가능도비라 해석되고, 검사결과의 전반적인 판별력 지표라 여겨진다. 또한, 질환에 대해 무병한 사람의 본 검사 결과가 양성일 확률에 비해, 유병한 사람의 검사 결과가 양성으로 나올 확률이 얼마나 큰지 알려 주는 지표이며, 1 보다 클수록 판별력이 우수하다고 볼수 있다. LR-는 음성 가능도비라 해석되고, 질환에 대해 무병한 사람의 검사 결과가 음성이 나올 확률에 비해, 유병한 사람의 검사 결과가 음성으로 나올 확률이 얼마나더 큰지 알려주는 지표이며, 1 보다 작은 값을 가지며, 값이 작을수록 좋다.
본 연구에서 제안한 특징선택을 이용한 심뇌혈관질환 예측 모델과, FRS로 계산한 결과의 ROC curve는 Fig. 4 와 같으며, 제안된 모델의 정확도가 나은 성능을 보였다.
본 연구에서는 데이터 셋 중, 심뇌혈관질환의 유병여부가 참값인 레코드들에 대해서만 데이터 대체를 진행하였다. 의료 데이터의 특성상, 특정 질환을 가진 환자의 수가 소수이기 때문에, 일률적 삭제의 방법보다는 데이터를 대체하는 것이 합리적이라 판단하였다.
데이터 전처리 단계는 데이터 정제(Data cleansing), 데이터 대체(Data imputation), 특징선택(Feature selection) 등으로 이뤄져있다. 통합된 데이터 셋에서 심뇌혈관질환 유병여부에 대해 참값을 포함한 레코드 수는 총 2910개로, 비유병자와의 데이터 균형이 맞지 않는다. 따라서 심뇌혈관질환의 유무에 따라 데이터 셋을 나눈 후, 나눠진 데이터 셋에 대해 데이터 정제와 대체 작업을 진행하고, 추출된 데이터 셋의 통합 이후에 특징선택을 진행한다.
후속연구
, 2006). 또한 FRS는 관상동맥질환의 발생 가능성에 대해서만 예측이 가능하다는 제한점이 있다. 최근에는 유럽의 SCORE산정법(Systematic Coronary Risk Ealuation)도 이용하며, ASCVD(Atherosclerotic Cardiova-scular Disease) 위험지수도 사용되고 있지만, 아시아인에 대해 과대평가 된다고 알려져 있다(Cho, 2018).
질의응답
핵심어
질문
논문에서 추출한 답변
심뇌혈관질환은 사망원인의 몇 %를 차지하는가?
암을 제외한 한국인의 가장 높은 사망원인은 심뇌혈관질환으로 사망원인의 24%를 차지한다. 현재 국내 환자의 심혈관질환의 위험도 산출은 프레밍험 위험지수를 기반으로 하지만, 국외의 가이드라인에 의존하고 있어 정확도가 떨어지는 편이며, 뇌혈관질환의 예측에 대한 위험도는 산출할 수 없다.
프레밍험위험지수의 단점은 무엇인가?
한국인의 심혈관질환 위험도는 프레밍험위험지수 (Framingham Risk Score, FRS)를 사용했지만(Wilson et al., 1998), 미국인을 대상으로 한 비교적 오래된 연구이고, 한국인에 대해서 과대평가 된다고 알려져 있다(Ahn et al., 2006).
특징부분 집합의 평가를 위해 MLP를 이용한 이유는 무엇인가?
심뇌혈관질환 예측 모델의 특징선택을 위해, 특징부분 집합의 평가에 MLP를 이용한다. 목적 모델과 동일한 분류기를 사용하는 특징선택 방법은 성능이 좋다고 알려져 있으나, 속성 개수에 따라 연산이 지수적으로 증가하여 효율이 떨어진다. 그러므로 본 논문에서는 IG 분석을 통한 특징부분집합의 최초 원소의 선택 후, MLP 기반 특징 선택을 진행한다.
참고문헌 (27)
건강보험심사평가원(보건의료빅데이터개방시스템, 국민관심질병통계), 2019. 03
김상현. (2016). 이상지질혈증 진료지침의 최신지견. Journal of the Korean Medical Association, 59(5), 349-351.
정일영, 김석관, 이다은, 이유현. (2016). 데이터 기반 헬스케어 혁신의 부상과 대응전략. 정책연구, 1-204.
Ahn, K. A., Yun, J. E., Cho, E. R., Nam, C. M., Jang, Y., & Jee, S. H. (2006). Framingham Equation Model Overestimates Risk of Ischemic Heart Disease in Korean Men and Women. Korean Journal of Epidemiology, 28(2), 162-170.
Cho, Y. G. (2018). Cardiovascular Risk Prediction in Korean Adults. Korean journal of family medicine, 39(3), 135-136.
Huda, S., Abawajy, J., Alazab, M., Abdollalihian, M., Islam, R., & Yearwood, J. (2016). Hybrids of support vector machine wrapper and filter based framework for malware detection. Future Generation Computer Systems, 55, 376-390.
Ian G,, Yoshua B., and Aaron C. (2016). Deep Learning. MIT Press.
Karegowda, A. G., Manjunath, A. S., & Jayaram, M. A. (2010). Comparative study of attribute selection using gain ratio and correlation based feature selection. International Journal of Information Technology and Knowledge Management, 2(2), 271-277.
Kent, J. T. (1983). Information gain and a general measure of correlation. Biometrika, 70(1), 163-173.
Myers, T. A. (2011). Goodbye, listwise deletion: Presenting hot deck imputation as an easy and effective tool for handling missing data. Communication Methods and Measures, 5(4), 297-310.
Pathria, R. K.; Beale, Paul (2011). Statistical Mechanics (Third Edition). Academic Press. p. 51. ISBN978-0123821881.
The Fifth Korea National Health and Nutrition Examination Survey (KNHANES V), 2010-2012, Korea Centers for Disease Control and Prevention.
The Fourth Korea National Health and Nutrition Examination Survey (KNHANES IV),2007- 2009, Korea Centers for Disease Control and Prevention.
The Seventh Korea National Health and Nutrition Examination Survey (KNHANES VII 1-2), 2016-2017, Korea Centers for Disease Control and Prevention.
The Sixth Korea National Health and Nutrition Examination Survey (KNHANES VI), 2013-2015, Korea Centers for Disease Control and Prevention.
Wilson P, D’Agostino R, Levy D, Belanger A, Silbershatz H, Kannel W (1998) Prediction of coronary heart disease using risk factor categories. Circulation 97(18), 1837-1874.
Yeonhee Bae, Kowoon Lee. (2016). Risk Factors for Cardiovascular Disease in Adults Aged 30 Years and Older. Journal of Korean Society of Integrative Medicine, 4(2), 97-107.
Young Mi Kang, Hyun Jin Kim, Tae-yong Lee, Bon Jeong Ku. (2017). The Relationship between Death and Clinical Risk Factors in Korean: Community Cohort Study. The Journal of the Korean Public Health Association, 43(3), 81-90.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.