$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 결측이 있는 이산형 공변량에 대한 Cox비례위험모형의 패턴-혼합 모델
Pattern-Mixture Model of the Cox Proportional Hazards Model with Missing Binary Covariates 원문보기

응용통계연구 = The Korean journal of applied statistics, v.25 no.2, 2012년, pp.279 - 291  

육태미 (고려대학교 통계학과) ,  송주원 (고려대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

공변량에 결측이 발생한 Cox 비례위험 모형을 적합할 때, 결측이 발생하는 개체를 모두 제거한 후 분석을 실시한다면 정보 손실에 의해 비효율적이고 결측의 발생 메커니즘이 완전 임의 결측(missing completely at random; MCAR)이 아니라면 모수의 추정값에 편향이 발생할 수 있다. Cox 비례위험 회귀모형의 공변량에 결측이 있는 경우 적용할 수 있는 여러 가지 방법들이 제안되어져 왔으나 이 분석들은 선택모델(selection model)에 기반하고 있다. 본 연구에서는 Little (1993)이 제안한 패턴-혼합 모델(pattern-mixture model)을 사용하여 Cox 비례위험 회귀모형에서 생존시간과 결측 메커니즘의 결합분포를 모델화 하고, 여러 가지 제약에 근거한 생존 분석의 결과를 비교하였다. 모의실험을 통해서 패턴-혼합 모델의 제약(restrictions)에 따른 모수 추정민감도를 확인하였고 결측을 무시한 채 분석한 결과 및 선택모형에 근거한 분석결과와 비교하였다. 패턴-혼합 모델의 제약에 따라 공변량의 결측으로 인한 모수 추정의 민감성 정도를 쥐백혈병 자료 예제를 통해 설명하였다.

Abstract AI-Helper 아이콘AI-Helper

When fitting a Cox proportional hazards model with missing covariates, it is inefficient to exclude observations with missing values in the analysis. Furthermore, if the missing-data mechanism is not Missing Completely At Random(MCAR), it may lead to biased parameter estimation. Many approaches have...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 기존의 연구들은 모두 선택 모델을 가정한 연구이며 Cox 비례위험 회귀모형의 공변량에 결측이 있을 때 패턴-혼합 모델(pattern-mixture model) (Little, 1993)을 이용한 연구는 찾기 힘들다. 본 논문에서는 패턴-혼합 모델을 이용하여 Cox 비례위험 모형을 위한 생존 자료와 결측 메커니즘의 결합분포를 모델화하고, 이 모델을 바탕으로 회귀계수의 추정값을 계산하였다. 또한 다양한 제약을 고려하여 공변량의 결 측이 모수의 추정에 미치는 영향을 살펴보았다.
  • 본 논문에서는 패턴-혼합 모델을 이용하여 Cox 비례위험 모형을 위한 생존 자료와 결측 메커니즘의 결합분포를 모델화하고, 이 모델을 바탕으로 회귀계수의 추정값을 계산하였다. 또한 다양한 제약을 고려하여 공변량의 결 측이 모수의 추정에 미치는 영향을 살펴보았다.
  • 으로 표현되며, 이때 (π, ϕ)는 각각 M의 주변 분포와 M이 주어졌을 때 Z의 조건부 분포의 알려지지 않은 모수를 나타낸다. 이 모델은 결측 메커니즘이 MCAR이 아닌 자료에 대한 유연성 있는 분석이 가능하도록 한다. 패턴이란 자료에서 결측이 발생되어 있는 모양을 나타내는 것으로 개체의 결측지시자 (mi1, mi2, .
  • Kalbfleisch와 Prentice (1980)의 쥐 백혈병 자료에 대하여 패턴-혼합 모형의 분석을 시행하였다. 이 자료는 Fred Hutchinson Cancer Center의 Dr. Robert Nowinski의 연구실에서 진행된 실험 자료로써 유전요인과 바이러스 요인이 백혈병에 걸린 쥐의 생존기간에 미치는 영향에 관한 연구를 목적으로 하고 있다. 자료에는 204마리의 쥐의 생존시간과 중도절단 여부를 포함한 9개 변수가 기록되어 있다.

가설 설정

  • 가장 흔히 고려되는 제약은 ‘완전히 관측된 자료-결측 변수(complete-case missing-variable; CCMV) 제약’으로, 완전 관측인 패턴 P0상의 모수와 모든 불완전하게 관측된 패턴들에서의 식별할 수 있는 모수들이 같다고 가정하고 분석하는 것이다.
  • 먼저, 완전 관측된 패턴 P0상의 분포와 패턴 P1상의 분포가 같다는 CCMV 제약 하에서 패턴 P1의 모형을 설정하고 이 모형 들의 모수를 사용하여 패턴 P1의 결측된 부분을 대체한다. 다음으로 P0과 대체된 P1을 혼합하여 하나의 패턴으로 간주하고, P0과 P1패턴의 자료를 더한 P01상의 분포와 패턴 P2의 분포가 동일하다는 가정 하에 패턴 P2를 위한 모형을 설정하여 결측된 부분을 대체한다. 3개 이상의 변수를 포함한 단조 형태의 자료에서도 이와 유사한 방법으로 확장 시킬 수 있다.
  • 생존시간 ti는 모수 λi = exp(z ′ iβ)인 지수분포에서 생성하고 중도 절단의 분포는 절단이 발생하지 않은 경우와 30% 절단이 발생한 경우의 두 가지 상태를 고려하였다. Cox 비례위험 회귀모형의 공변량들은 이산형 변수 2개가 존재하는 경우를 고려하였고, 첫 번째 공변량은 확률 0.5로 0 또는 1의 값을 갖고 두 공변량들은 서로 오즈비가 9라고 가정 하였다. 표본의 크기는 200개로 정하고 실험을 1000번 반복 시행하였다.
  • 표본의 크기는 200개로 정하고 실험을 1000번 반복 시행하였다. 첫 번째 모의실험은 Z1의 모든 개체가 관측되고 Z2의 50%가 결측인 단조형태를 가정하였고, MCAR과 MAR 2가지 결측자료 메커니즘을 고려하였다. 결측 메커니즘이 MCAR일 때는 완전 임의로 결측을 생성하였고 MAR일 때는 추적(follow-up) 시간이 긴 쪽의 50%를 결측시켰다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
Cox 비례위험 모형에서 결측이 발생하는 경우에는 무엇이 있는가? Cox 비례위험 모형에서 결측이 발생하는 경우는 생존시간의 중도절단(censoring)과 공변량에 결측이 있는 두 가지의 경우가 가능하다. 공변량에 결측이 없으나 중도절단에 의해 불완전한 생존 자료의 분석을 위해 부분가능도(partial likelihood) 함수를 최대화 시키는 모수추정량을 찾는 방법이 제안되어져 왔다 (Cox, 1972, 1975).
결측자료 메커니즘이 비임의결측인 경우 어떤 방법이 제안되었는가? 결측자료 메커니즘이 임의결측(MAR)일 때는 비모수적 가능도(non-parametric likelihood; NPL)함수를 최대화 시켜 모수를 추정할 수 있고 (Chen과 Little, 1999), 이 모수 추정량은 관측 상태인 개체만 가지고 분석하는 방법보다 더 효율적인 것으로 나타났다. 또한 결측 자료 메커니즘이 비임의결측(NMAR)일 때는 공변량의 모수적 분포와 결측 메커니즘을 특성화 시킨 후, 몬테카를로 EM(monte carlo EM) 알고리즘을 통해서 모수들을 추정하는 방법이 제안되었다 (Herring 등, 2004).
공변량에 결측이 존재한다면 무엇을 고려하여 분석해야하는가? 공변량에 결측이 없으나 중도절단에 의해 불완전한 생존 자료의 분석을 위해 부분가능도(partial likelihood) 함수를 최대화 시키는 모수추정량을 찾는 방법이 제안되어져 왔다 (Cox, 1972, 1975). 공변량에 결측이 존재한다면 Cox의 비례위험 회귀모형의 모수 추정은 중도절단 상태뿐 아니라 결측 자료 메커니즘(missing data mechanism)도 함께 고려하여 분석되어야 한다. 이 결 측자료에 대한 모형은 Cox 비례위험 모형과 결측 자료 메커니즘에 대한 분포의 결합분포로 표현되는데 현재까지 진행되어온 대부분의 연구에서는 변수들과 결측 메커니즘의 결합 분포를 선택 모델(selection model) (Hogan과 Laird, 1997)로 가정하여 분석하는 방법들이 제안되어 왔다.
질의응답 정보가 도움이 되었나요?

참고문헌 (14)

  1. Chen, H. Y. and Little, R. J. A. (1999). Proportional hazards regression with missing covariates, Journal of the American Statistical Association, 94, 896-908. 

  2. Cox, D. R. (1972). Regression models and life-tables (with discussion), Journal of the Royal Statistical Society, Series B, 34, 187-220. 

  3. Cox, D. R. (1975). Partial likelihood, Biometrika, 62, 269-279. 

  4. Demirtas, H. (2005). Multiple imputation under Bayesianly smoothed pattern-mixture models for nonignorable drop-out, Statistics in Medicine, 24, 2345-2363. 

  5. Herring, A. H. and Ibrahim, J. G. (2001). Likelihood-based methods for missing covariates in the Cox proportional hazards model, Journal of the American Statistical Association, 96, 292-302. 

  6. Herring, A. H., Ibrahim, J. G. and Lipsitz, S. R. (2004). Non- ignorable missing covariate data in survival analysis: A case-study of an International Breast Cancer Study Group trial, Journal of the Royal Statistical Society, 53, 293-310. 

  7. Hogan, J. W. and Laird, N. M. (1997). Model-based approaches to analysing incomplete longitudinal and failure time data, Statistics in Medicine, 16, 259-272. 

  8. Kalb eisch, J. D. and Prentice, R. L. (1980). The Statistical Analysis of Failure Time Data, Wiley, New York. 

  9. Lin, D. Y. and Ying, Z. (1993). Cox regression with incomplete covariate measurements, Journal of the American Statistical Association, 88, 1341-1349. 

  10. Little, R. J. A. (1993). Pattern-Mixture models for multivariate incomplete data, Journal of the American Statistical Association, 88, 125-134. 

  11. Little, R. J. A. and Rubin, D. B. (2002). Statistical Analysis With Missing Data, Wiley, New York. 

  12. Molenberghs, G., Michiels, B., Kenward, M. G. and Diggle, P. J. (1998). Monotone missing data and patternmixture models, Statistica Neerlandica, 52, 153-161. 

  13. Thijs, H., Molenberghs, G., Michiels, B., Verbeke, G. and Curran, D. (2002). Strategies to fit pattern-mixture models, Biostatistics, 3, 245-265. 

  14. Wang, C. and Daniels, M. J. (2011). A note on MAR, identifying restrictions, model comparison, and sensitivity analysis in Pattern-Mixture models with and without covariates for incomplete data, Biometrics, 67, 810-818. 

저자의 다른 논문 :

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로