$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

랜덤효과를 포함한 영과잉 포아송 회귀모형에 대한 베이지안 추론: 흡연 자료에의 적용
A Bayesian zero-inflated Poisson regression model with random effects with application to smoking behavior 원문보기

응용통계연구 = The Korean journal of applied statistics, v.31 no.2, 2018년, pp.287 - 301  

김연경 (중앙대학교 응용통계학과) ,  황범석 (중앙대학교 응용통계학과)

초록
AI-Helper 아이콘AI-Helper

0이 과도하게 많이 나타나는 자료는 여러 다양한 분야에서 흔히 볼 수 있다. 이러한 자료들을 분석할 때 대표적으로 영과잉 포아송 모형이 사용된다. 특히 반응변수들 사이에 상관관계가 존재할 때에는 랜덤효과를 영과잉 포아송 모형에 도입해서 분석해야 한다. 이러한 모형은 주로 빈도론자들의 접근방법으로 분석되어왔는데, 최근에는 베이지안 기법을 사용한 분석도 다양하게 발전되어 왔다. 본 논문에서는 반응변수들 사이에 상관관계가 존재하는 경우 랜덤효과가 포함된 영과잉 포아송 회귀모형베이지안 추론 방법을 토대로 제안하였다. 이 모형의 적합성을 판단하기 위해 모의 실험을 통해 랜덤효과를 고려하지 않은 모형과 비교 분석하였다. 또한, 실제 지역사회 건강조사 흡연 자료에 직접 응용하여 그 결과를 살펴보았다.

Abstract AI-Helper 아이콘AI-Helper

It is common to encounter count data with excess zeros in various research fields such as the social sciences, natural sciences, medical science or engineering. Such count data have been explained mainly by zero-inflated Poisson model and extended models. Zero-inflated count data are also often corr...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 반응변수 사이에 상관관계가 존재하는 영과잉 이산형의 형태를 띠는 자료에 대해서 랜덤효과를 포함한 영과잉 포아송 모형을 고려하여 베이지안 접근방법을 사용하여 추론을 하려고 한다. 제시된 방법으로 전국의 20대 남자의 흡연 자료에 적용해본다.
  • 그 중에서도 기존의 빈도론자들의 MLE이 가지고 있는 한계를 극복하고자 베이지안 추론 방법이 다양하게 발전되어 왔다. 본 논문에서는 반응변수들 사이에 상관관계가 존재하는 경우를 분석하기 위해 랜덤효과가 포함된 ZIP 회귀모형을 베이지안 추론 방법을 토대로 제안하였다.

가설 설정

  • b1, . . . , bI는 독립적인 표준정규분포를 따르는 랜덤효과이고 그에 상응하는 계수는 γ라고 가정한다.
  • 반응변수들이 서로 상관관계가 존재하는 영과잉 이산형 데이터에 대해서 본 논문에서 제안된 랜덤효과를 포함한 ZIP 회귀모형의 적합성을 검증하기 위해 각기 다른 6개의 시나리오로 구성된 모의 실험을 시행하였다. 각 시나리오들은 분석의 간편성을 위해 하나의 공변량을 베르누이 분포 부분과 포아송 분포 부분에 공통적으로 사용한다고 가정한다. 즉, 식 (2.
  • 본 논문에서는 공변량을 베르누이 분포 부분과 포아송 분포 부분에 공통적으로 사용한다고 가정하였고, 랜덤효과를 위해 랜덤 절편이 포아송 모형 부분에만 포함된다고 가정하였다. 서로 다른 공변량을 도입하고, 랜덤 기울기를 포함한 랜덤효과를 베르누이와 포아송 분포 두 부분에 모두 포함시킨다면 보다 일반적인 모형으로 발전시킬 수 있을 것이다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
ZIP 모형은 무엇인가? 이와 같이 0의 값이 과도하게 많이 관측되는 자료를 분석하기 위해서 Cohen (1963)은 영과잉 포아송 모형(zero-inflated Poisson; ZIP)을 제안하였다. ZIP 모형은 0에 대한 점확률(point mass)과 기존의 포아송 분포를 혼합하여 영과잉 부분과 0이 아닌 부분을 설명하는 모형이다. Lambert (1992)는 공변량(covariates)을 모형에 도입하여 영과잉 포아송 회귀모형(ZIP regression; ZIPR)을 제안하였고, Greene (1994)은 음이항 분포(negative binomial)를 고려하여 영과잉 음이항 모형(zero-inflated negative binomial; ZINB)으로 확장하였다.
이산형 자료에서 0이 과도하게 많은 경우에 포아송 모형의 특징은? 예를 들어, 어떤 제품의 불량품 개수, 자동차 보험금 청구 횟수, 1년 동안 병원 응급실 이용 횟수 등의 자료에서는 0의 값의 비율이 상당히 높게 나타난다. 일반적으로 셀 수 있는 이산형 자료에 대한 대표적인 모형인 포아송 모형에서는 평균과 분산이 동일하다는 가정이 성립해야 하지만, 0이 과도하게 많은 경우에는 평균에 비해 분산이 과도하게 커지는 현상이 나타나게 된다. 이와 같이 0의 값이 과도하게 많이 관측되는 자료를 분석하기 위해서 Cohen (1963)은 영과잉 포아송 모형(zero-inflated Poisson; ZIP)을 제안하였다.
다변량 영과잉 포아송 모형, ZIP 모형 등의 분석에 빈도론자들의 접근 방법을 사용하는 것의 문제는? 이러한 모형의 분석방법으로 최대가능도 방법(maximum likelihood method)에 기반을 둔 빈도론자(frequentist)들의 접근 방법이 널리 사용되어 왔다. 하지만, 표본의 크기가 크지 않고, 영과잉 자료와 같이 매우 치우진 분포를 갖는 경우 최대가능도추정량(maximum likelihood estimator; MLE)은 점근적 정규성(asymptotic normality)이 성립하지 않는 단점을 가지고 있다. 이를 보안하기 위해 최근에는 베이지안 추론 방법이 많이 사용되어 왔다 (Angers와 Biswas, 2003; Rodrigues, 2003; Ghosh 등, 2006; Oh와 Lim, 2006; Jang 등, 2008; Shim 등, 2011; Lee 등, 2011a; Liu와 Powers, 2012).
질의응답 정보가 도움이 되었나요?

참고문헌 (22)

  1. Angers, J. F. and Biswas, A. (2003). Bayesian analysis of zero-in?ated generalized Poisson model, Computational Statistics and Data Analysis, 42, 37-46. 

  2. Celeux, G., Forbes, F., Robert, C. P., and Titterington, D. M. (2006). Deviance information criterion for missing data models, Bayesian Analysis, 1, 651-674. 

  3. Cohen, A. C. (1963). Estimation in mixtures of discrete distributions. In Proceedings of the International Symposium on Discrete Distributions, Montreal, 373-378. 

  4. Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., and Rubin, D. B. (2014). Bayesian Data Analysis, CRC Press, New York. 

  5. Ghosh, S. K., Mukhopadhyay, P., and Lu, J. C. (2006). Bayesian analysis of zero-in?ated regression models, Journal of Statistical Planning and Inference, 136, 1360-1375. 

  6. Greene, W. H. (1994). Accounting for excess zeros and sample selection in Poisson and negative binomial regression models, NYU Working Paper, No. EC-94-10. 

  7. Haario, H., Saksman, E., and Tamminen, J. (2005). Componentwise adaptation for high dimensional MCMC, Computational Statistics, 20, 265-273. 

  8. Hall, D. B. (2000). Zero-in?ated Poisson and binomial regression with random e?ects: a case study, Biometrics, 56, 1030-1039. 

  9. Jang, H., Kang, Y., Lee, S., and Kim, S. W. (2008). Bayesian analysis for the zero-in?ated regression models, The Korean Journal of Applied Statistics, 21, 603-613. 

  10. Lambert, D. (1992). Zero-in?ated Poisson regression, with an application to defects in manufacturing, Technometrics, 34, 1-14. 

  11. Lee, J., Choi, T., and Woo, Y. (2011a). Bayesian approaches to zero in?ated Poisson model, The Korean Journal of Applied Statistics, 24, 677-693. 

  12. Lee, K., Joo, Y., Song, J. J., and Harper, D. W. (2011b). Analysis of zero-in?ated clustered count data: a marginalized model approach, Computational Statistics and Data Analysis, 55, 824-837. 

  13. Li, C. S., Lu, J. C., Park, J., Kim, K., Brinkley, P. A., and Peterson, J. P. (1999). Multivariate zero-in?ated Poisson models and their applications, Technometrics, 41, 29-38. 

  14. Liu, H. and Powers, D. A. (2012). Bayesian inference for zero-in?ated Poisson regression models, Journal of Statistics: Advances in Theory and Applications, 7, 155-188. 

  15. Min, Y. and Agresti, A. (2005). Random e?ect models for repeated measures of zero-in?ated count data, Statistical Modelling, 5, 1-19. 

  16. Neelon, B. H., O'Malley, A. J., and Normand, S. L. T. (2010). A Bayesian model for repeated measures zero-in?ated count data with application to outpatient psychiatric service use, Statistical Modelling, 10, 421-439. 

  17. Oh, M. S. and Lim, A. K. (2006). Bayesian analysis of a zero-in?ated Poisson regression model: An application to Korean oral hygienic data, The Korean Journal of Applied Statistics, 19, 505-519. 

  18. Ridout, M., Hinde, J., and Demetrio, C. G. B. (2001). A score test for testing a zero-in?ated Poisson regression model against zero-in?ated negative binomial alternatives, Biometrics, 57, 219-223. 

  19. Rodrigues, R. (2003). Bayesian analysis of zero-in?ated distributions, Communications in Statistics, 32, 281-289. 

  20. Shim, J., Lee, D. H., and Jung, B. C. (2011). Bayesian inference for the zero in?ated negative binomial regression model, The Korean Journal of Applied Statistics, 24, 951-961. 

  21. Spiegelhalter, D. J., Best, N. G., Carline, B. P., and Van Der Linde, A. (2002). Bayesian measures of model complexity and ?t, Journal of the Royal Statistical Society: Series B, 64, 583-639. 

  22. Yau, K. K. W. and Lee, A. H. (2001). Zero-in?ated Poisson regression with random e?ects to evaluate an occupational injury prevention program, Statistics in Medicine, 20, 2907-2920. 

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로