$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 고차원자료에서의 다중검정의 활용
Multiple testing and its applications in high-dimension 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.24 no.5, 2013년, pp.1063 - 1076  

장원철 (서울대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

현대 과학기술의 발전으로 빅데이터의 시대가 도래하였다, 이러한 빅데이터는 여러가지 과학적 문제에 대한 해답을 제공하지만 반면에 이로 인해 새로운 도전에 직면하고 있다. 마이크로어레이 자료와 같은 고차원자료는 이러한 빅데이터에서 흔히 볼 수 있는 유형중의 하나이다. 본 논문에서는 고차원 자료분석에 많이 쓰이고 있는 대역검정과 동시검정, 그리고 이의 응용에 대한 소개를 한다.

Abstract AI-Helper 아이콘AI-Helper

The power of modern technology is opening a new era of big data. The size of the datasets affords us the opportunity to answer many open scientific questions but also presents some interesting challenges. High-dimensional data such as microarray are common in big data. In this paper, we give an over...

Keyword

질의응답

핵심어 질문 논문에서 추출한 답변
다중비교에서 필수적인 것은 무엇인가? 예를 들면 생물정보학에서 마이크로어레이 자료 분석의 경우 유전자의 갯수가 자료의 갯수보다 많고 각각의 유전자에 대한 발현여부를 통계적 가설검정을 이용하여 알고자 할 때 연구자들은 유전자의 갯수만큼 적게는 수천에서 많게는 수만개의 가설검정을 동시에 행하 게 된다. 이러한 다중비교에서 오류 (error rate)의 조정은 필수적이다. 기존의 가설검정방법을 오발견 (false discovery)에 대한 고려없이 사용할 경우, 즉 각각의 유전자에 대한 유의수준 0.
FDR 방법론은 어떠한 분야에 성공적으로 사용되었는가? FDR 방법은 사실 1980년대 의학통계에서 쓰였던 다중검정 방법에서 그 유래를 찾을 수 있다. 이후 이 방법론은 다양한 분야의 연구, 신호처리에서 웨이블렛 함수의 분계점 선택 (threshold selection), 천 체물리학에서 우주배경복사 (cosmic microwave background)를 이용한 빅뱅이론의 확인, 마이크로어레 이 자료의 분석 등에 성공적으로 사용되었다 (Lindsay 등, 2004). Table 1.
빅데이터 분석에 가장 유용한 분석방법들에는 무엇이 있는가? 21세기는 빅데이터의 도래로 많은 분야의 연구들이 새로운 통계분석방법을 요구한다. 현재 빅데이터 분석에 가장 유용한 분석방법들로는 다중검정방법, 구체적으로 대역검정 (global testing)과 동시검정 (simultaneous testing)을 들 수 있겠다. 예를 들면 생물정보학에서 마이크로어레이 자료 분석의 경우 유전자의 갯수가 자료의 갯수보다 많고 각각의 유전자에 대한 발현여부를 통계적 가설검정을 이용하여 알고자 할 때 연구자들은 유전자의 갯수만큼 적게는 수천에서 많게는 수만개의 가설검정을 동시에 행하 게 된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (21)

  1. Arias-Castro, E., Candes, E. J. and Plan, Y. (2011). Global testing under sparse alternatives: Anova, multiple comparisons and the higher criticism. Annals of Statistics, 39, 2533-2556. 

  2. Benjamini, Y., Drai, D., Elmer, G., Kafkafi, N. and Golani, I (2001). Controlling the false discovery rate in behavior genetics research. Behavioural Brain Research, 125, 279-284. 

  3. Benjamini, Y. and Hochberg, Y. (1995). Controlling the false discovery rate: A practical and powerful approach to multiple testing. Journal of the Royal Statistical Society B, 57, 289-300. 

  4. Benjamini, Y. and Yekutieli, D. (2001). The control of the false discovery rate in multiple testing under dependency. Annals of Statistics, 29, 1165-1188. 

  5. Donoho, D. L. and Jin, J. (2004). Higher criticism for detecting sparse heterogeneous mixtures, Annals of Statistics, 32, 962-994. 

  6. Efron, B. (2010). Large-scale inferece: Empirical Bayes methods for estimation, testing, and prediction, Cambridge University Press, Cambridge. 

  7. Fan, J. (1996). Test of significance based on wavelet thresholding and Neyman's truncation. Journal of the American Statistical Association, 91, 674-688. 

  8. Fan, J. and Lin, S.-K.(1998). Test of significance when data are curves. Journal of the American Statistical Association, 93, 1007-1021. 

  9. Genovese, C. R., Lazar, N. A. and Nichols, T. (2002). Thresholding of statistical maps in functional neuroimaging using false discovery rate. Neuroimage, 15, 870-878. 

  10. Genovese, C. R. and Wasserman, L. A. (2004). A stochastic process approach to false discovery control. Annals of Statistics, 32, 1035-1061. 

  11. Jin, J. (2008). Proportion of non-zero normal means: Universal oracle equivalences and uniformly consistent estimators. Journal of the Royal Statistical Society B, 70, 461-493. 

  12. Lindsay, B. G., Kettenring, J. and Siegmund, D. O. (2004). A report on the future of statistics. Statistical Science, 19, 387-413. 

  13. Park, C., Ahn, J., Hendry, M. and Jang, W. (2011). Analysis of long period variable stars with nonparametric tests for trend detection. Journal of the American Statistical Association, 106, 832-845. 

  14. Patti, M. E., Butte, A. J., Crunkhorn, S., Cusi, K., Berria, R., Kashyap, S., Miyazaki, Y., Kohane, I., Costello, M., Saccone, R., Landaker, E. J., Goldfine, A. B., Mun, E., DeFronzo, R., Finlayson, J., Kahn, C. R. and Mandarino, L. J. (2003). Coordinate reduction of genes of oxidative metabolism in humans with insulin resistance and diabetes: Potential role of PGC1 and NRF1. Proceedings of the National Academy Sciences of USA, 100, 8466-8471. 

  15. Purcell, S., Neale, B., Todd-Brown, K., Thomas, L., Ferreira, M. A., Bender, D., Maller, J., Sklar, P., de Bakker, P. I., Daly, M. J. and Sham, P. C. (2007). PLINK: A tool set for whole-genome association and population-based linkage analyses. American Journal of Human Genetics, 81, 559-575. 

  16. Storey, J. D. (2002). A direct approach to false discovery rates. Journal of the Royal Statistical Society B, 100, 9440-9445. 

  17. Storey, J. and Tibshirani, R. (2003). Statistical significance for genomewide studies. Proceedings of the National Academy Sciences of USA, 98, 5116-5121. 

  18. Tusher, V. G., Tibshirani, R. and Chu, G. (2001). Significance analysis of micorarrays applied to the ionizing radiation response. Proceedings of the National Academy Sciences of USA, 98, 5116-5121. 

  19. Weisberg, S. P., McCann, D., Desai, M., Rosenbaum, M., Leibel, R. L. and Ferrante, A. W. (2003). Obesity is associated with macrophage accumulation in adipose tissue. Journal of Clinical Investigation, 112, 1796-1808. 

  20. Wilkinson, L. (1999). Statistical methods in psychology journals: Guidelines and explanations. American Psychologist, 54, 594-604. 

  21. Wit, E. (2010). Comments on Discovering the false discovery rate by Benjamini. Journal of the Royal Statistical Society B, 72, 410-411. 

저자의 다른 논문 :

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로