$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 결시적 자료에서 관측 중단을 모형화하기 위해 사용되는 경쟁 위험의 적용과 결합 모형
Joint model of longitudinal data with informative observation time and competing risk 원문보기

응용통계연구 = The Korean journal of applied statistics, v.29 no.1, 2016년, pp.113 - 122  

김양진 (숙명여자대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

경시적 자료는 반복적으로 측정된 다변량 자료의 한 형태로 임상학, 보건학, 경제학에서 자주 발생된다. 시계열자료와 구분되는 가장 큰 특징은 표본수와 공변량 효과의 추정에 있다. 경시적 자료는 일반적으로 시계열 자료보다 더 큰 표본 개체로 이루어져 있으며 연구의 주 관심은 특정 공변량의 효과를 추정하는 데 있다. 또한 시계열 자료보다 반복 측정 횟수가 짧으며 개체마다 다른 관측 횟수와 다른 관측 중단 시점을 가질 수 있다. 본 연구에서는 관측 시점과 관측 종료 원인이 경시자료와 서로 연관된 경우에 결합 모형을 적용함으로써 이들간의 연관성을 분석하고자한다. 따라서 이들 변량간의 연관성을 모형화하기 위해 이변량 랜덤효과가 적용된다. 실제 자료 분석에서는 간경변증 환자의 핼액 응고 수치 시간을 관심 있는 경시적 자료로 환자가 병원 방문시점과 관측 중단원인들간의 상호 연관관계를 규명하고자 하였다. 특히, 중도 절단원인은 사망이나 간이식을 받는 사건일 때 발생하는데 본 연구에서는 사망 사건과의 연관성이 고려되었다. 결과를 통해 혈액 응고 시간이 길고 병원 방문 시점이 빈번할수록 사망할 가능성이 높음을 알수 있었다. 또한 혈액응고 시간이 길수록 병원 방문 횟수가 빈번하였다.

Abstract AI-Helper 아이콘AI-Helper

Longitudinal data often occur in prospective follow-up studies. Joint model for longitudinal data and failure time has been applied on several works. In this paper, we extend it to the case where longitudinal data involve informative observation time process as well as competing risks survival times...

Keyword

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구의 주 관심은 경시자료가 서로 다른 시점에서 서로 다른 반복횟수를 가지고 관측될 때, 관측 시점과 관측 중도 절단의 원인에 대한 모형을 경시자료와 함께 고려하고자 한다. 이러한 복잡한 자료 구조 패턴 하에서 세 가지 요소(경시적 자료, 관측 시점, 관측 종료 원인)를 동시에 고려하기 위해 결합 모형(joint model)이 적용되며 이 세 가지 요소간의 연관성을 위해 랜덤 효과(random effect)가 고려된다.
  • 본 연구에서 분석한 자료는 경시적 자료, 관측 시점 그리고 결측 시점과 그 원인에 대한 자료를 동시에 고려하는 결합모형을 제안하는 것이다. 첫 번째 구성 요소는 반응 변수에 대한 것으로 xij와 vi1이 주어져 있을 때, 다음 모형을 가정한다.
  • 이러한 두 가지 중단 원인을 동시에 고려하기 위해 경쟁 위험 모형의 원인별 위험 함수 모형이 적용되었다. 본 연구에서는 사망을 주 관심으로 하자. 142명의 환자는 D-penicillin을 투여받았으며 144명은 기존의 약을 투여받았다.
  • 반응 변수인 프로트로빔에 유의한 영향을 주는 요인으로 D-penicillin 그룹여부(D-penicillin 처리 그룹 = 1, 그외 처리 그룹 = 0)와 성별(남성 = 1; 여성 = 0)을 고려하며 시간 관련 추세를 표현하기 위해 선형함수를 가정으로 한다. 본 연구에서는 관측 중단 원인 중에 사망과 프로트롬빈 그리고 방문 시점과의 관계를 조사하고자 한다. Table 4.
  • 본 연구에서는 특수 시계열 자료의 예로 경시적 자료에 관한 논문을 다루었다. 특히 관측 시점과 관측횟수가 개체마다 다르고 관측 중도 절단이 발생할 경우 이들간의 상호 연관관계를 추정하기 위해 결합모형을 적용하였다.
  • Sun 등 (2007)은 적절한 가중치를 사용한 방정식을 이용하였다.본 논문에서는 관측 중단의 원인이 여러 개인 경우를 모형화하기 위해 경쟁위험 모형이 적용되었으며 특히 원인 별 위험 함수(cause-specific hazard function)를 통해 공변량의 유의성과 경시적 자료와 관측 시점과의 연관성을 검토하였다. 경쟁 위험 모형에 대해 빈번하게 사용되는 다른 회귀 모형으로는 Fine와Gray (1999)가 제안한 subdistribution 모형이 있다.
  • 경쟁 위험 모형에 대해 빈번하게 사용되는 다른 회귀 모형으로는 Fine와Gray (1999)가 제안한 subdistribution 모형이 있다. 그들의 모형에서는 이미 경쟁 사건을 경험한 개체를 위험그룹에서 제외시키는 기존의 방법 말고 그들이 여전히 위험그룹에 남아있다고 가정하고 그들에게 적절한 가중치를 부여함으로써 경쟁 위험 모형의 특성을 반영하고자 하였다. 본 논문의 향후 연구과제는 이러한 subdistribution 모형과 경시자료를 동시에 고려하는 추정 방정식을 유도하고자 한다.
  • 그들의 모형에서는 이미 경쟁 사건을 경험한 개체를 위험그룹에서 제외시키는 기존의 방법 말고 그들이 여전히 위험그룹에 남아있다고 가정하고 그들에게 적절한 가중치를 부여함으로써 경쟁 위험 모형의 특성을 반영하고자 하였다. 본 논문의 향후 연구과제는 이러한 subdistribution 모형과 경시자료를 동시에 고려하는 추정 방정식을 유도하고자 한다.

가설 설정

  • 두 번째 구성요소인 wi(tij)는 시점간의 연관관계(serial correlation)을 모형화하기 위해 적용되며 예를 들어 Cor(t, t + u) = ρ(u) = exp(−ϕu) 또는 ρ(u) = exp(−ϕu2)와 같은 지수 상관 모형이 고려될 수있다. 마지막으로 ϵij는 측정 오차로, ϵik와 ϵil은 서로 독립이며 평균이 0이고 분산이 #인 정규 분포를 가정한다. 따라서 모형 (2.
  • 마지막으로 전이 모형은 마르코브 모형이라고도 하며 현재 반응치가 과거 관측자료에 의존하는 것을 가정으로 한다. 따라서 이들 관계를 모형에 직접적으로 대입하여 추정할 수 있다.
  • , n, )을 관측하게 된다. 여기서 경시 자료 yij는 관측시점 tij에서 측정되며 본 연구에서는 연속형 확률변수를 가정한다. 공변량 xij는 p × 1 벡터로 경시자료와 관련된 공변량으로 시간 가변공변량을 포함하며 zij는 방문 시점(또는 관측 시점)에 유의한 관계를 가질 것으로 예상되는 공변량이며 wi는 관측 중단 시점에 대한 모형을 위해 적용될 공변량이다.
  • 본 연구에서 분석한 자료는 경시적 자료, 관측 시점 그리고 결측 시점과 그 원인에 대한 자료를 동시에 고려하는 결합모형을 제안하는 것이다. 첫 번째 구성 요소는 반응 변수에 대한 것으로 xij와 vi1이 주어져 있을 때, 다음 모형을 가정한다.
  • 따라서, 위 모형 하에서 ξ1k =0은 반응 변수와 k번째 관측 중단 원인과의 독립성을 의미하며, ξ2k = 0은 관측 시점과 k번째 관측 중단원인의 독립성을 각각 의미한다. 특히 본 연구에서는 랜덤 효과 (vi1, vi2)는 다음과 같은 이변량 정규 분포를 가정한다.
  • 142명의 환자는 D-penicillin을 투여받았으며 144명은 기존의 약을 투여받았다. 반응 변수인 프로트로빔에 유의한 영향을 주는 요인으로 D-penicillin 그룹여부(D-penicillin 처리 그룹 = 1, 그외 처리 그룹 = 0)와 성별(남성 = 1; 여성 = 0)을 고려하며 시간 관련 추세를 표현하기 위해 선형함수를 가정으로 한다. 본 연구에서는 관측 중단 원인 중에 사망과 프로트롬빈 그리고 방문 시점과의 관계를 조사하고자 한다.
  • 반복적으로 관측되는 경시자료의 분석 목적은 시간에 따라 변화하는 패턴과 공변량의 효과를 추정하는 것이다. 먼저 경시자료 yi = (yi1, . . . , yimi), i = 1, . . . , n가 연속형 자료라고 가정하자. 경시적 자료에 대한 가장 초기의 모형으로는 잘 알려진 ANOVA(analysis of variance) 모형의 확장이 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
Gaussian quadrature를 이용한 수치 적분을 이용하는 방법의 장점은? 본 논문에서는 Gaussian quadrature를 이용한 수치 적분을 이용하였다. 이 방법의 장점은 SAS의 NLIMIXED 프로시져를 사용할 수 있다는 점이다. 하지만 초기값에 민감하며 모형이 복잡하면 수렴에 실패하는 경우가 종종 발생한다.
MNAR의 특징은? 따라서 결측 발생 확률에 대한 결측 자료와의 관계를 통해 다음의 두 가지 가정이 고려된다. 구체적으로 결측 발생 확률은 이미 관측된 자료에 의존하지만 결측 자료와는 무관함을 가정하는 MAR(missing at random)과 결측 발생이 관측되지 않은 결측 자료와 연관성이 존재함을 가정하는 MNAR(missing not at random) 또는 NIR(non ignorable) 모형으로 분류할 수 있다. 예를 들어, 간경변증 자료에서 간이식과 사망은 관측 중도 절단의 원인이며 이 사건의 발생은 관측 중단으로 인해 관측 되지 못한 환자의 상태와 연관되었을 가능성이 있다.
MAR의 특징은? 따라서 결측 발생 확률에 대한 결측 자료와의 관계를 통해 다음의 두 가지 가정이 고려된다. 구체적으로 결측 발생 확률은 이미 관측된 자료에 의존하지만 결측 자료와는 무관함을 가정하는 MAR(missing at random)과 결측 발생이 관측되지 않은 결측 자료와 연관성이 존재함을 가정하는 MNAR(missing not at random) 또는 NIR(non ignorable) 모형으로 분류할 수 있다. 예를 들어, 간경변증 자료에서 간이식과 사망은 관측 중도 절단의 원인이며 이 사건의 발생은 관측 중단으로 인해 관측 되지 못한 환자의 상태와 연관되었을 가능성이 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (19)

  1. Cook, R. and Lawless, J. (2007). The Statistical Analysis of Recurrent Events, Springer. 

  2. Diggle, P. J., Heagerty, P., Liang, K.-Y., and Zeger, S. L. (2001). Analysis of Longitudinal Data, Oxford Press. 

  3. Elashoff, R. M., Li, G., and Li, N. (2007). An approach to joint analysis of longitudinal measurements and competing risks failure time data, Statistics in Medicine, 26, 2813-2835. 

  4. Fine, J. P. and Gray, R. J. (1999). A proportional hazards model for the subdistribution of a competing risk, Journal of the American Statistical Association, 94, 496-509. 

  5. Fitzmaurice, G. M., Laird, N. M., and Rotnitzky, A. G. (2004). Applied Longitudinal Analysis, Wiley, Hoboken NJ. 

  6. Free, E. (2004). Longitudinal and Panel Data: Analysis and Applications in the Social Sciences, Cambridge University Press. 

  7. Goldstein, H. (1995). Multilevel Statistical Models, 2nd Ed, Edward Arnold, London. 

  8. Harville, D. (1977). Maximum likelihood approaches to variance component estimation and to related problems, Journal of the American Statistical Association, 72, 320-338. 

  9. Henderson, R., Diggle, P., and Dobson, A. (2000). Joint modelling of longitudinal measurements and event time data, Biostatistics, 1, 465-480. 

  10. Kalbfleisch, J. D. and Prentice, R. L. (2002). The Statistical Analysis of Failure Time Data, John Wiley, New York. 

  11. Kim, Y.-J. (2010). Statistical Analysis of recidivism data using frailty effect, Korean Journal of Applied Statistics, 23, 715-724. 

  12. Laird, N. M. and Ware, J. H. (1982). Random effects models for longitudinal data, Biometrics, 38, 963-974. 

  13. Liang, K.-Y. and Zeger, S. L. (1986). Longitudinal data analysis using generalized linear models, Biometrika, 73, 13-22. 

  14. Liu, L. and Huang, X. (2009). Joint analysis of correlated repeated measures and recurrent events processes in the presence of death, with application to a study on acquired immune deficiency syndrome, Applied Statistics, 58, 65-81. 

  15. Rizopoulos, D. (2012). Joint Models for Longitudinal and Time-to-Event Data: with Applications in R, Chapman and Hall/CRC. 

  16. Sun, J., Sun, D., and Liu, D. (2007). Regression analysis of longitudinal data in the presence of informative observation and censoring times, Journal of the American Statistical Association, 102, 1397-1406. 

  17. Tsiatis, A. and Davidian, M. (2004). Joint modeling of longitudinal and time-to-event data: an overview, Statistica Sinica, 14, 809-834. 

  18. Wedderburn, R. W. M. (1974). Quasi-likelihood functions, generalized linear models, and Gauss-Newton method, Biometrika, 61, 439-447. 

  19. Wulfsohn, M. S. and Tsiatis, A. A. (1997). A joint model for survival and longitudinal data measured with error, Biometrics, 53, 330-339. 

저자의 다른 논문 :

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로