$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

베이지안 순서형 프로빗 준모수 회귀 모형 : 국민건강영양조사 2016 자료를 통한 흡연양태와 커피섭취 간의 관계 분석
Bayesian ordinal probit semiparametric regression models: KNHANES 2016 data analysis of the relationship between smoking behavior and coffee intake 원문보기

응용통계연구 = The Korean journal of applied statistics, v.33 no.1, 2020년, pp.25 - 46  

이다솜 ,  이은지 (고려대학교 통계학과) ,  조성일 (전북대학교 통계학과 (응용통계연구소)) ,  최태련 (고려대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 Bayesian spectral analysis regression (BSAR) 방법론을 이용한 베이지안 순서형 프로빗 준모수 회귀모형에 대해서 고찰한다. 순서형 프로빗 회귀모형은 순서가 있는 범주형 자료를 모형화하는 방법으로, 정규 분포의 분포함수의 역함수인 프로빗 연결함수를 이용해 각 범주의 확률과 설명변수을 연결함으로써 반응변수의 확률을 모형화한다. 베이지안 프로빗 회귀 모형은 정규 분포를 따르는 잠재변수를 도입함으로써 사후 분포 도출을 용이하게 하고, 절단점에 따라 나뉘어지는 잠재변수들의 값에 따라서 반응 변수들이 범주화된다. 본 논문에서는 이러한 잠재 변수 방법을 확장해 BSAR 방법론에 기반하여 단조증가/감소와 같은 형태제약을 반영할 수 있는 베이지안 이항형 및 순서형 프로빗 준모수 회귀모형에 대해 연구한다. 모의실험을 통하여 이항형 프로빗 준모수 회귀모형과 기존의 다른 모형들 간의 적합결과를 비교하고, 형태 제약에 따른 순서형 프로빗 준모수 회귀모형의 적합결과를 비교 분석하도록 한다. 아울러, 국민건강영양조사 제 7기 1차년도 (2016) 자료(Korean National Health and Nutrition Examination Survey (KNHANES), 2016)를 바탕으로, 본 논문에서 고찰한 이항형 및 순서형 프로빗 준모수 회귀모형을 적용하여, 흡연양태와 커피섭취 간의 관계에 대한 실증적 분석을 수행한다.

Abstract AI-Helper 아이콘AI-Helper

This paper presents ordinal probit semiparametric regression models using Bayesian Spectral Analysis Regression (BSAR) method. Ordinal probit regression is a way of modeling ordinal responses - usually more than two categories - by connecting the probability of falling into each category explained b...

주제어

표/그림 (15)

질의응답

핵심어 질문 논문에서 추출한 답변
BART란 무엇인가? 명목형 변수를 위한 비모 수적 베이지안 방법에 있어서는 Chipman 등 (2010)의 Bayesian additive regression tree (BART)가 대표적인 방법이라고 할 수 있다. BART는 정규화 사전 분포(regularization prior)를 사용하고, 반응 변수의 확률을 프로빗 연결함수를 통해 m개의 설명력이 약한 나무들의 합으로 표현하는 방식으로, R의 BART 패키지의 pbart함수를 통해 적합할 수 있다. BART를 통한 비모수적 접근 방법 외에, Wood (2017)에서는 mgcv패키지의 jagam함수를 통해 GAM 모형을 베이지안 방식으로 적합할 수 있도록 하였다.
이항형 반응변수를 분류하는 방식은 무엇에 용이한가? Albert와 Chib (1993)은 이항확률에 프로빗 연결함수를 직접 적용하는 방식 대신 선형회귀모형을 통해 설명된는 잠재변수 값에 따라 이항형 반응변수를 분류하는 방식을 채택하였다. 이러한 접근방식은 사전 분포와 사후 분포 간의 켤레성(conjugacy)으로 인해 사후 분포 도출에 용이하기 때문에 베이지안 범주형 자료 분석의 토대가 되었다. 명목형 변수를 위한 비모 수적 베이지안 방법에 있어서는 Chipman 등 (2010)의 Bayesian additive regression tree (BART)가 대표적인 방법이라고 할 수 있다.
BSAR 방법이 매우 유용할 것이라고 판단되는 이유는? 또한, 순서형 범주를 적합하기 위한 스플라인 회귀 모형은 대해서는 Wood (2017)의 gam의 ocat family를 참조해 모형을 적합할 수 있지만, 현재 로짓 링크만 제한적으로 사용할 수 있기 때문에, 실용적인 면에 있어서는 다소 간의 한계를 보인다. 이에 반해, BSAR 방법은 가우지안 확률과정과 코사인 기 저를 바탕으로 한 다소 복잡한 적합방식이지만, 단조증가, 감소 뿐 아니라 오목,볼록, U자형, S자형 등 의 다양한 형태제약을 반영할 수 있으며 (Lenk와 Choi, 2017), R 패키지 bsamGP (Jo 등, 2019)에서 다양한 모형적합을 제공하기 때문에, 본 논문에서의 연구와 같은 실제 자료분석에 있어서 매우 유용할 것이라고 판단된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (32)

  1. Agresti, A. (2013). Categorical Data Analysis (3rd ed), John Wiley & Sons, NJ. 

  2. Ahn, H. J., Gwak, J. I., Yun, S. J., Choi, H. J., Nam, J. W., and Shin, J. S. (2017). The influence of coffee consumption for smoking behavior, Korean Journal of Family Practice, 7, 218-222. 

  3. Albert, J. H. and Chib, S. (1993). Bayesian analysis of binary and polychotomous response data, Journal of the American Statistical Association, 88, 669-679. 

  4. Carmody, T. P., Brischetto, C. S., Matarazzo, J. D., O’Donnell, R. P., and Connor, W. E. (1985). Cooccurrent use of cigarettes, alcohol, and coffee in healthy, community-living men and women. Health Psychology, 4, 323. 

  5. Chen, M. H. and Dey, D. K. (2000). Bayesian analysis for correlated ordinal data models. In Generalized Linear Models: A Bayesian Perspective (volume 5, pages 133-157), Dekker, New York. 

  6. Chipman, H. A., George, E. I., and McCulloch, R. E. (2010). BART: Bayesian additive regression trees, The Annals of Applied Statistics, 4, 266-298. 

  7. Cho, K. S. (2013). Prevalence of hardcore smoking and its associated factors in Korea, Health and Social Welfare Review, 33, 603-628. 

  8. Clark, A., Georgellis, Y., and Sanfey, P. (2001). Scarring: The psychological impact of past unemployment, Economica, 68, 221-241. 

  9. Cowles, M. K., Carlin, B. P., and Connett, J. E. (1996). Bayesian tobit modeling of longitudinal ordinal clinical trial compliance data with nonignorable missingness, Journal of the American Statistical Association, 91, 86-98. 

  10. Geisser, S. and Eddy, W. F. (1979). A predictive approach to model selection, Journal of the American Statistical Association, 74, 153-160. 

  11. Harris, M. N. and Zhao, X. (2007). A zero-inflated ordered probit model, with an application to modelling tobacco consumption, Journal of Econometrics, 141, 1073-1099. 

  12. Hasegawa, H. (2010). Analyzing tourists' satisfaction: a multivariate ordered probit approach, Tourism Management, 31, 86-97. 

  13. Hastie, T. J. and Tibshirani, R. J. (1990). Generalized additive models, Monographs on Statistics and Applied Probability (Vol 43), Chapman and Hall, London. 

  14. Jara, A., Hanson, T. E., and Lesaffre, E. (2009). Robustifying generalized linear mixed models using a new class of mixtures of multivariate Polya trees, Journal of Computational and Graphical Statistics, 18, 838-860. 

  15. Jo, S., Choi, T., Park, B., and Lenk, P. (2019). bsamGP: An R package for Bayesian spectral analysis models using Gaussian process priors, Journal of Statistical Software, 90, 1-41. 

  16. Jung, K. W., Won, Y. J., Kong, H. J., Lee, E. S., and Community of Population-Based Regional Cancer Registries (2018). Cancer statistics in Korea: incidence, mortality, survival, and prevalence in 2015, Cancer Research and Treatment: Official Journal of Korean Cancer Association, 50, 303-316. 

  17. Kang, E., Lee, J. A., and Cho, H. J. (2017). Characteristics of hardcore smokers in South Korea from 2007 to 2013, BMC Public Health, 17, 521. 

  18. Kim, M. (2015). Semiparametric approach to logistic model with random intercept, Korean Journal of Applied Statistics, 28, 1121-1131. 

  19. Kockelman, K. M. and Kweon, Y. J. (2002). Driver injury severity: an application of ordered probit models, Accident Analysis & Prevention, 34, 313-321. 

  20. Koop, G., Poirier, D. J., and Tobias, J. L. (2007). Bayesian Econometric Methods (Econometric Exercises), Cambridge University Press, Cambridge. 

  21. Korean Centers for Disease Control and Prevention (2016). The Seventh Korea National Health and Nutrition Examination Survey (KNHANES VII-1). 

  22. Lee, J. H. and Heo, T. Y. (2014). A study of effect on the smoking status using multilevel logistic model, Korean Journal of Applied Statistics, 27, 89-102. 

  23. Lenk, P. J. and Choi, T. (2017). Bayesian analysis of shape-restricted functions using Gaussian process priors, Statistica Sinica, 27, 43-69. 

  24. Moon, S. (2016). Types of smoking statuses and associated factors among Korean wageworkers, Journal of Korean Public Health Nursing, 30, 495-511. 

  25. Nelder, J. A. and Wedderburn, R. W. (1972). Generalized linear models, Journal of the Royal Statistical Society. Series A (General), 135, 370-384. 

  26. Park, J. C., Kim, M. H., and Lee, J. Y. (2018). Nomogram comparison conducted by logistic regression and naive Bayesian classifier using type 2 diabetes mellitus (T2D), Korean Journal of Applied Statistics, 31, 573-585. 

  27. Seok, H. E., Bang, H. J., and Kim, S. Y. (2017). Bayesian analysis of KBSID-III adaptive behavior data using a zero-inflated ordered probit model, Korean Journal of Psychology: General, 36, 215-239. 

  28. Sha, N. and Dechi, B. O. (2019). A Bayes inference for ordinal response with latent variable approach, Stats, 2, 321-331. 

  29. Tan, Y. V. and Roy, J. (2019). Bayesian additive regression trees and the general BART model, Statistics in Medicine, 38, 5048-5069. 

  30. Watanabe, S. (2010). Asymptotic equivalence of Bayes cross validation and widely applicable information criterion in singular learning theory, Journal of Machine Learning Research, 11, 3571-3594. 

  31. Wood, S. N. (2017). Generalized Additive Models: An Introduction with R (2nd ed), CRC Press, Florida. 

  32. Xie, Y., Zhang, Y., and Liang, F. (2009). Crash injury severity analysis using Bayesian ordered probit models, Journal of Transportation Engineering, 135, 18-25. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로