[국내논문] 유전자 발현 데이터에 대한 다중검정법 비교 및 분석
Comparison and analysis of multiple testing methods for microarray gene expression data 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.25 no.5, 2014년, pp.971 - 986  

서수민 (덕성여자대학교 정보통계학과) ,  김태훈 (덕성여자대학교 PrePharmMed 학과) ,  김재희 (덕성여자대학교 정보통계학과)

AI-Helper 아이콘AI-Helper

동시에 여러 개의 가설검정 수행시 귀무가설이 참일 경우 귀무가설을 기각할 확률이 커지는 문제가 발생한다. 이러한 다중검정 문제 해결을 위해 여러 연구에서는 가설검정시 필요한 집단별 오류율(FWER; family-wise error rate), 위발견율 (FDR; false discovery rate) 또는 위비발견율 (FNR; false nondiscovery rate) 과 통계량을 고려하여 검정력을 높이고자 하였다. 본 연구에서는 T 통계량, 수정된 T 통계량, 그리고 LPE (local pooled error) 통계량 기반 P값을 이용한 Bonferroni (1960) 방법, Holm (1979) 방법, Benjamini와 Hochberg (1995) 방법과 Benjamini와 Yekutieli (2001) 방법 그리고 Z 통계량 기반 Sun과 Cai (2007) 방법을 고찰하고 모의실험을 통해 다중검정 능력을 비교하였다. 또한 실제 데이터로 애기장대 유전자 발현 데이터에 대해 여러 가지 다중검정법을 통해 유의한 유전자들을 선별하였다.

Abstract AI-Helper 아이콘AI-Helper

When thousands of hypotheses are tested simultaneously, the probability of rejecting any true hypotheses increases, and large multiplicity problems are generated. To solve these problems, researchers have proposed different approaches to multiple testing methods, considering family-wise error rate (...



핵심어 질문 논문에서 추출한 답변
다중검정 문제를 고려해야 하는 경우는? 동시에 여러 개의 가설검정을 수행해야하는 경우 다중검정 (multiple tesing) 문제를 고려해야한다. 특히 수백 수천 개의 가설들을 동시에 검정해야하는 대규모 다중비교 (large-scale multiple comparison)의 경우 귀무가설이 참인 경우와 그렇지 않은 경우를 구별해내는 것이 연구 목표가 된다.
집단별 오류율은 무엇을 의미하는가? (1) 집단별 오류율 (FWER; family-wise error rate) : 다중비교 가설검정시 최소한 하나 또는 그 이상의 제 1종 오류가 발생할 확률을 의미 한다.
대규모 다중비교를 하는 경우 필요한 작업은? 특히 수백 수천 개의 가설들을 동시에 검정해야하는 대규모 다중비교 (large-scale multiple comparison)의 경우 귀무가설이 참인 경우와 그렇지 않은 경우를 구별해내는 것이 연구 목표가 된다. 이러한 경우 각 가설에 대한 검정통계량으로부터 얻을 수 있는 정보, 제 1종 오류 등에 대한 고려가 필요하며 여러 개의 연관된 가설검정으로부터 얻은 통계량을 동시에 분석하고 해석하여 결론을 이끌어내는데 오류가 없는 작업이 필요하다.
질의응답 정보가 도움이 되었나요?

