Apolipoprotein E(APOE) 유전자의 ε4 다형성(polymorphism)은 Late-Onset Alzheimer’s Disease(LOAD) 발병에 영향을 주는 가장 중요한 유전적 요인으로 알려져 있다. 하지만 APOE ε4 다형성 단독으로 LOAD의 발병 ...
Apolipoprotein E(APOE) 유전자의 ε4 다형성(polymorphism)은 Late-Onset Alzheimer’s Disease(LOAD) 발병에 영향을 주는 가장 중요한 유전적 요인으로 알려져 있다. 하지만 APOE ε4 다형성 단독으로 LOAD의 발병 위험도를 예측하기에는 정확도가 충분치 않다는 한계가 있다. LOAD가 여러 유전 변이들의 복합적인 상호작용의 결과임을 생각해 볼 때, APOE ε4와 상호작용하는 다른 유전 변이들을 발굴하고 이를 모두 통합할 수 있는 LOAD 발병 위험도 예측 모델을 개발해야 할 필요가 있다. 본 연구에서는 변이 간의 상호작용을 고려하기 힘든 기존의 genome-wide association study(GWAS) 분석법의 한계를 보완하기 위해 Random Forest 알고리즘을 사용하여 14개의 single nucleotide polymorphism(SNP)를 선발하였고, 4 종류의 기계 학습법(Logistic Regression, Neural Net, Random Forest, XGBoost)을 적용하여 LOAD 발병 위험도 예측 모델을 개발하였다. 모델 학습 과정에는 The Translational Genomics Research Institute(TGen)에서 분양 받은 LOAD GWAS dataset을 사용하였고, Alzheimer's Disease Neuroimaging Initiative(ADNI)에서 분양 받은 GWAS dataset을 사용하여 모델의 성능을 검증하였다. XGBoost 알고리즘을 사용하여 개발된 최종 LOAD 예측 모델은 accuracy(ACC): 0.742, area under the receiver operating characteristic curve(AUROC): 0.791, average precision(AP): 0.420의 성능을 보였다. 이번 연구를 통해 APOE ε4 유전형과 상호작용하며 치매 감수성에 영향을 줄 것으로 기대되는 14개의 single nucleotide polymorphism(SNP) 마커 후보를 선발하였고, 이 14개의 SNP와 APOE ε4 유전형 정보를 바탕으로 LOAD환자와 정상인을 구분할 수 있는 기계 학습 모델을 개발하였다.
Apolipoprotein E(APOE) 유전자의 ε4 다형성(polymorphism)은 Late-Onset Alzheimer’s Disease(LOAD) 발병에 영향을 주는 가장 중요한 유전적 요인으로 알려져 있다. 하지만 APOE ε4 다형성 단독으로 LOAD의 발병 위험도를 예측하기에는 정확도가 충분치 않다는 한계가 있다. LOAD가 여러 유전 변이들의 복합적인 상호작용의 결과임을 생각해 볼 때, APOE ε4와 상호작용하는 다른 유전 변이들을 발굴하고 이를 모두 통합할 수 있는 LOAD 발병 위험도 예측 모델을 개발해야 할 필요가 있다. 본 연구에서는 변이 간의 상호작용을 고려하기 힘든 기존의 genome-wide association study(GWAS) 분석법의 한계를 보완하기 위해 Random Forest 알고리즘을 사용하여 14개의 single nucleotide polymorphism(SNP)를 선발하였고, 4 종류의 기계 학습법(Logistic Regression, Neural Net, Random Forest, XGBoost)을 적용하여 LOAD 발병 위험도 예측 모델을 개발하였다. 모델 학습 과정에는 The Translational Genomics Research Institute(TGen)에서 분양 받은 LOAD GWAS dataset을 사용하였고, Alzheimer's Disease Neuroimaging Initiative(ADNI)에서 분양 받은 GWAS dataset을 사용하여 모델의 성능을 검증하였다. XGBoost 알고리즘을 사용하여 개발된 최종 LOAD 예측 모델은 accuracy(ACC): 0.742, area under the receiver operating characteristic curve(AUROC): 0.791, average precision(AP): 0.420의 성능을 보였다. 이번 연구를 통해 APOE ε4 유전형과 상호작용하며 치매 감수성에 영향을 줄 것으로 기대되는 14개의 single nucleotide polymorphism(SNP) 마커 후보를 선발하였고, 이 14개의 SNP와 APOE ε4 유전형 정보를 바탕으로 LOAD환자와 정상인을 구분할 수 있는 기계 학습 모델을 개발하였다.
Apolipoprotein E epsilon-4(APOE ε4) polymorphism is the main genetic factor known to increase the risk of Late-Onset Alzheimer’s Disease(LOAD). Even though APOE ε4 polymorphism is a strong determinant of LOAD, the predictive ability is not enough to be used in clinical diagnosis when it is considere...
Apolipoprotein E epsilon-4(APOE ε4) polymorphism is the main genetic factor known to increase the risk of Late-Onset Alzheimer’s Disease(LOAD). Even though APOE ε4 polymorphism is a strong determinant of LOAD, the predictive ability is not enough to be used in clinical diagnosis when it is considered solely. Given the fact that LOAD is a complex disease which can be influenced by several interactions between a range of genetic factors, it is necessary to find the interaction counterparts of APOE ε4 and integrate them all into the LOAD prediction model. In this study, we selected 14 important single nucleotide polymorphism(SNP)s based on Random Forest variable importance value in which the interaction between SNPs were considered and constructed a genetic risk prediction model for LOAD with four machine learning algorithms, Logistic Regression, Neural Net, Random Forest, and XGBoost. The genome-wide association study dataset of LOAD obtained from Translational Genomics Research Institute(TGen) were used as a training dataset, and an independent dataset obtained from Alzheimer's Disease Neuroimaging Initiative(ADNI) were used as an external validation dataset. The final model based on XGBoost algorithm showed the highest discriminability in the external validation dataset; accuracy(ACC), area under the receiver operating characteristic curve(AUROC), and average precision(AP) were 0.742, 0.791, and 0.420 respectively. In conclusion, we identified 14 candidate LOAD risk SNPs which are expected to be associated with LOAD by making an interaction with APOE ε genotype and constructed a machine learning-based prediction model for LOAD which showed acceptable discrimination performance between LOAD and normal control group.
Apolipoprotein E epsilon-4(APOE ε4) polymorphism is the main genetic factor known to increase the risk of Late-Onset Alzheimer’s Disease(LOAD). Even though APOE ε4 polymorphism is a strong determinant of LOAD, the predictive ability is not enough to be used in clinical diagnosis when it is considered solely. Given the fact that LOAD is a complex disease which can be influenced by several interactions between a range of genetic factors, it is necessary to find the interaction counterparts of APOE ε4 and integrate them all into the LOAD prediction model. In this study, we selected 14 important single nucleotide polymorphism(SNP)s based on Random Forest variable importance value in which the interaction between SNPs were considered and constructed a genetic risk prediction model for LOAD with four machine learning algorithms, Logistic Regression, Neural Net, Random Forest, and XGBoost. The genome-wide association study dataset of LOAD obtained from Translational Genomics Research Institute(TGen) were used as a training dataset, and an independent dataset obtained from Alzheimer's Disease Neuroimaging Initiative(ADNI) were used as an external validation dataset. The final model based on XGBoost algorithm showed the highest discriminability in the external validation dataset; accuracy(ACC), area under the receiver operating characteristic curve(AUROC), and average precision(AP) were 0.742, 0.791, and 0.420 respectively. In conclusion, we identified 14 candidate LOAD risk SNPs which are expected to be associated with LOAD by making an interaction with APOE ε genotype and constructed a machine learning-based prediction model for LOAD which showed acceptable discrimination performance between LOAD and normal control group.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.