$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

생물/보건/의학 연구를 위한 비모수 베이지안 통계모형

Nonparametric Bayesian Statistical Models in Biomedical Research

응용통계연구 = The Korean journal of applied statistics, v.27 no.6, 2014년, pp.867 - 889  

노희상 (한국과학기술원 수리과학과) ,  박진수 (한국과학기술원 수리과학과) ,  심규석 (한국과학기술원 수리과학과) ,  유재은 (한국과학기술원 수리과학과) ,  정연승 (한국과학기술원 수리과학과)

초록
AI-Helper 아이콘AI-Helper

비모수 베이지안 통계 모형은 그 유연성과 계산의 편리성으로 인해 최근 다양한 분야에서 응용되고 있는데, 본 논문에서는 생물/의학/보건 연구에서 사용되는 비모수 베이지안 통계 모형에 대해서 개괄하였다. 본 논문에서는 비모수 베이지안 통계 모델링에서 핵심적으로 사용되는 확률모형들을 소개하고, 다양한 예제들을 통하여 그 모형들이 어떻게 사용되는지 이해를 돕도록 하였다. 특별히, 논의된 예제들은 모수적 통계 모형으로 고찰하기에는 한계가 있는 연구가설들을 포함하고 있어 모수적 모형의 한계점을 지적하고 비모수적 베이지안 모형의 필요성을 강조하는 것들로 정하였다. 크게 확률밀도함수 추정, 군집분석, 임의효과 분포의 추정, 그리고 회귀분석의 4가지 주제로 분류하여 살펴보았다.

Abstract AI-Helper 아이콘AI-Helper

Nonparametric Bayesian (np Bayes) statistical models are popularly used in a variety of research areas because of their flexibility and computational convenience. This paper reviews the np Bayes models focusing on biomedical research applications. We review key probability models for np Bayes infere...

주제어

질의응답

핵심어 질문 논문에서 추출한 답변
비모수적 베이지안 통계모형의 핵심은? 비모수적 베이지안 통계모형의 핵심은 자료의 확률분포함수를 특정 모수적 분포가 아닌 임의의 유동적인 분포로 설정하고, 이 분포에 사전분포를 설정하여 사후추론을 하는 것이다. 베이지안 통계모형의 경우 비모수적 모델링을 통해 자료의 분포함수뿐만 아니라, 임의효과의 분포 혹은 관심모수의 사전분포 또한 유동적인 모형화가 가능하여 보다 넓은 클래스의 확률모형을 제시할 수 있다.
베이지안 통계모형을 통해 제시할 수 있는 것은? 비모수적 베이지안 통계모형의 핵심은 자료의 확률분포함수를 특정 모수적 분포가 아닌 임의의 유동적인 분포로 설정하고, 이 분포에 사전분포를 설정하여 사후추론을 하는 것이다. 베이지안 통계모형의 경우 비모수적 모델링을 통해 자료의 분포함수뿐만 아니라, 임의효과의 분포 혹은 관심모수의 사전분포 또한 유동적인 모형화가 가능하여 보다 넓은 클래스의 확률모형을 제시할 수 있다. 따라서 비모수적 베이지안 통계 모델링을 위해서는 임의분포에 대한 사전분포가 핵심요소이며, 가장 많이 사용되는 확률 모형은 디리슈레 확률과정(Dirichlet process; DP)이다 (Ferguson, 1973, 1974).
디리슈레 확률과정이 비모수 베이지안 통계모형에서 가장 많이 사용되는 이유는? 임의분포 G에 대한 사전분포로 DP 이외에도 다양한 모형이 제시되었는데, DP가 비모수 베이지안 통계모형에서 가장 많이 사용되는 이유는 첫째로 계산적으로 단순하다는 것과 둘째로 식 (1.1)의 구조를 변형하여 보다 일반적인 모형으로의 확장이 매우 용이하기 때문이다 (Dunson, 2010). 임의의 변량 θi의 분포를 G로 가정하고, G가 DP를 따른다고 했을 때, G에 대한 해석적 주변화(analytical marginalization)를 통해, θi의 주변 분포를 구할 수 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (45)

  1. Baladandayuthapani, V., Mallick, B. K. and Carroll, R. J. (2005). Spatially adaptive Bayesian penalized regression splines(P-splines), Journal of Computational and Graphical Statistics, 14, 378-394. 

  2. Barnes, T. G., Jefferys, W. H., Berger, J. O., Muller, P., Orr, K. and Rodriguez, R. (2003). A Bayesian analysis of the Cepheid distance scale, The Astrophysical Journal, 592, 539. 

  3. Blackwell, D. and MacQueen, J. B. (1973). Ferguson distributions via Polya urn schemes, Annals of Statistics, 1, 353-355. 

  4. Blei, D. M., Ng, A. Y. and Jordan, M. I. (2003). Latent Dirichlet allocation, 

  5. Brown, E. R., Ibrahim, J. G. and DeGruttola, V. (2005). A flexible B-spline model for multiple longitudinal Biomarkers and survival, Biometrics, 61, 64-73. 

  6. Bush, C. A. and MacEachern, S. N. (1996). A semiparametric Bayesian model for randomized block designs, Biometrika, 83, 275-285. 

  7. Dahl, D. B. (2006). Model-based clustering for expression data via a Dirichlet process mixture model, In Vannucci, M., Do, K. A. and Muller, P. (eds.), Bayesian Inference for Gene Expression and Proteomics, Cambridge University Press. 

  8. De Iorio, M., Muller, P., Rosner, G. L. and MacEachern, S. N. (2004). An ANOVA model for dependent random measures, Journal of the American Statistical Association, 99, 205-215. 

  9. De Iorio, M., Johnson, W. O., Muller, P. and Rosner, G. L. (2009). Bayesian nonparametric non-proportional hazards survival modeling, Biometrics, 65, 762-771. 

  10. De la Cruz, R., Quintana, F. A. and Muller, P. (2007). Semiparametric Bayesian classification with longitudinal markers, Applied Statistics, 56, 119-137. 

  11. Dunson, D. B. and Park, J. H. (2008). Kernel stick-breaking processes, Biometrika, 95, 307-323. 

  12. Dunson, D. B., Pillai, N. and Park, J. H. (2007). Bayesian density regression, Journal of the Royal Statistical Society, Series B, 69, 163-183. 

  13. Dunson, D. B. (2010). Nonparametric Bayes applications to Biostatistics. Bayesian Nonparametrics, Chapter 7, Cambridge University Press. 

  14. Escobar, M. D., (1994). Estimating normal means with a Dirichlet process prior, Journals of the American Statistical Association, 89, 268-277. 

  15. Ferguson, T. S. (1973). A Bayesian analysis of some nonparametric problems, The Annals of Statistics, 1, 209-230. 

  16. Ferguson, T. S. (1974). Prior distributions on spaces of probability measures, The Annals of Statistics, 2, 615-629. 

  17. Guglielm, A., Ruggeri, F. and Soriano, J. (2014). Semiparametric Bayesian models for clustering and classification in the presence of unbalanced in-hospital survival, Journal of the Royal Statistical Society, Series C, 63, 25-46. 

  18. Guindani, M., Sepulveda, N., Paulino, C. D. and Muller, P. (2012). A Bayesian Semi-parametric approach for the differential analysis of sequence counts data, Technical report, M. D. Anderson Cancer Center. 

  19. Hanson, T. E. and Johnson, W. O. (2002). Modeling regression error with a mixture of Polya trees, Journal of the American Statistical Association, 97, 1020-1033. 

  20. Hartigan, J. A. (1990). Partition models, Communications in Statistics: Theory and Methods, 19, 2745-2756. 

  21. Ishwaran, H. and James, L. F. (2001). Gibbs sampling methods for stick-breaking priors, Journal of the American Statistical Association, 96, 161-173. 

  22. Ji, Y., Yin, G., Tsui, K. W., Kolonin, M. G., Sun, J., Arap, W., Pasqualini, R. and Do, K. A. (2007). Bayesian mixture models for complex high dimensional count data in phage display experiments, Journal of the Royal Statistical Society, Series C: Applied Statistics, 56, 139-152. 

  23. Kleinman, K. and Ibrahim, J. (1998a). A Semi-parametric Bayesian approach to the random effects model, Biometrics, 54, 921-938. 

  24. Kleinman, K. and Ibrahim, J. (1998b). A Semi-parametric Bayesian approach to generalized linear mixed models, Statistics in Medicine, 17, 2579-2596. 

  25. Kormaksson, M., Booth, J. G., Figueroa, M. E. and Melnick, A. (2012). Integrative model-based clustering of microarray methylation and expression data., Annals of Applied Statistics, 6, 1327-1347. 

  26. Kundu, S. and Dunson, D. B. (2014). Bayes variable selection in semiparametric linear models, Journal of the American Statistical Association, 109, 437-447. 

  27. Leon-Novelo, L. G., Muller, P., Arap, W., Kolonin, M. Sun, J., Pasqualini, R. and Do, K. A. (2013). Semiparametric Bayesian inference for phage display data, Biometrics, 69, 174-183. 

  28. Liu, Q., Lin, K. K., Andersen, B., Smyth, P., and Ihler, A. (2010). Estimating replicate time shifts using Gaussian process regression, Bioinformatics, 26, 770-776. 

  29. Longnecker, M. P., Klebanoff, M. A., Zhou, H. and Brock, J. W. (2001). Association between maternal serum concentration of the DDT metabolite DDE and preterm and small-for-gestational-age babies at birth, Lancet, 358, 110-114. 

  30. MacEachern, S. (1994). Estimating normal means with a conjugate style Dirichlet process prior, Communications in Statistics: Simulation and Computation, 23, 727-741. 

  31. MacEachern, S. (1999). Dependent nonparametric processes, in ASA Proceedings of the Section on Bayesian Statistical Science, American Statistical Association. 

  32. Mukhopadhyay, S. and Gelfand, A. (1997). Dirichlet process mixed generalized linear models, Journal of the American Statistical Association, 92, 633-639. 

  33. Muller, P., Erkanli, A. and West, M. (1996). Bayesian curve fitting using multivariate normal mixtures, Biometrika, 83, 67-79. 

  34. Muller, P. and Rosner, G. (1997). A Bayesian population model with hierarchical mixture priors applied to blood count data, Journal of the American Statistical Association, 92, 633-639. 

  35. Muller, P., Quintana, F. and Rosner, G. (2007). Semiparametric Bayesian inference for multilevel repeated measurement data, Biometrics, 63, 280-289. 

  36. Muller, P., Quintana, F. and Rosner, G. L. (2011). A product partition model with regression on covariates, Journal of Computational and Graphical Statistics, 20, 260-278. 

  37. Quintana, F. A. (2006). A predictive view of Bayesian clustering, Journal of Statistical Planning and In- ference, 136, 2407-2429. 

  38. Rice, J. A. and Wu, C. O. (2001). Nonparametric mixed effects models for unequally sampled noisy curves, Biometrics, 57, 253-259. 

  39. Rodriguez, A., Dunson, D. B. and Gelfand, A. E. (2008). The nested Dirichlet process, Journal of the American Statistical Association, 103, 1131-1154. 

  40. Rodriguez, A. and Dunson, D. B. (2011). Nonparametric Bayesian models through probit stick-breaking processes, Bayesian Analysis, 6, 145-178. 

  41. Sethuraman, J. (1994). A constructive definition of Dirichlet priors, Statistica Sinica, 4, 639-650. 

  42. Teh, Y. W., Jordan, M. I., Beal, M. J., & Blei, D. M. (2006). Hierarchical Dirichlet processes, Journal of the American statistical association, 101, 1566-1581. 

  43. Vidakovic, B. (1998). Nonlinear wavelet shrinkage with Bayes rules and Bayes factors, Journal of the American Statistical Association, 93, 173-179. 

  44. Walker, S. and Mallick, B. (1997). Hierarchical generalized linear models and frailty models with Bayesian nonparametric mixing, Journal of the Royal Statistical Society, 59, 845-860. 

  45. Zellner, A. (1986). On assessing prior distributions and Bayesian regression analysis with g-prior distributions, In Bayesian Inference and Decision Techniques: Essays in Honor of Bruno de Finetti, (eds. P. K. Goel and A. Zellner), 233-243, North-Holland/Elsevier. 

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트