본 논문에서는 몇몇 상황에서 Robins에 의한 Structural Nested Failure Time Models(SNFTM)를 사용하여 평균 인과 효과(ACE)의 편향되지 않은 추정치를 얻는 방법을 제안했다. SNFTM은 시간에 따라 변화하고 다음 시점의 교란 변수에 영향을 미치는 처치 변수의 생존 시간에 대한 인과 효과를 추정하는 데 사용되는 모형이다.
첫째, 측정되지 않은 교란변수가 있는 SNFTM를 사용하여 인과 효과를 추정하는 방법을 제안했다. 편향되지 않은 인과 효과를 추정하려면 모든 교란변수를 측정해야 한다. 하지만 현실적으로 모든 교란변수가 관측되는 것은 거의 불가능하다. 이를 위해, 관측되지 않은 교란변수가 있을 때, 많이 사용되는 방법인 ...
본 논문에서는 몇몇 상황에서 Robins에 의한 Structural Nested Failure Time Models(SNFTM)를 사용하여 평균 인과 효과(ACE)의 편향되지 않은 추정치를 얻는 방법을 제안했다. SNFTM은 시간에 따라 변화하고 다음 시점의 교란 변수에 영향을 미치는 처치 변수의 생존 시간에 대한 인과 효과를 추정하는 데 사용되는 모형이다.
첫째, 측정되지 않은 교란변수가 있는 SNFTM를 사용하여 인과 효과를 추정하는 방법을 제안했다. 편향되지 않은 인과 효과를 추정하려면 모든 교란변수를 측정해야 한다. 하지만 현실적으로 모든 교란변수가 관측되는 것은 거의 불가능하다. 이를 위해, 관측되지 않은 교란변수가 있을 때, 많이 사용되는 방법인 도구변수(IV) 방법을 SNFTM에 적용하였다. 도구변수 방법에서 2SRI를 사용하였다. 이 때 관측되지 않은 교란변수는 처치변수와 가법적인 관계에 있어야 하기 때문에, 잔차를 계산할 때 선형 모형을 가정하였다. 인과 효과의 추정치는 실제 인과 효과에 대한 일치추정량이 될 수 있다. 그리고 본 논문에서는 SNFTM과 도구변수 방법을 사용하여 SNFTM의 성능을 비교했다. 측정되지 않은 교란변수가 존재하는 경우 도구변수 방법을 사용한 SNFTM의 편향은 SNFTM보다 낮았다. 그리고 도구변수가 처치 변수와 큰 상관관계를 갖는 경우 모형의 표준 오차도 감소한다.
둘째, 3장에서는 SNFTM이 임의 효과를 고려하는 방법을 제안하였다. 반복 측정되는 경시적 자료에서는 개체내상관이 나타낼 수 있다. 하지만 SNFTM는 반복측정되는 시간 종속 처치 변수의 개체 내 상관을 고려하지 않는다. 따라서 SNFTM에서 로지스틱 회귀분석의 우도함수를 사용하여 추정방정식을 계산하는 것처럼, 개체 내 상관을 고려하여 GLMM을 사용한 추정식을 계산한다. 그리고 이 추정방정식도 SNFTM의 g-estimation과 마찬가지로 grid search을 사용한다. 데이터에 개체 내 상관이 없는 경우, SNFTM with RI(SNFTM with random intercept)를 사용한 SNFTM와 기존의 SNFTM의 성능에는 큰 차이가 없다. 하지만 데이터에 개체 내 상관이 있을 경우, 기존의 SNFTM의 편향은 SNFTM with RI에 비해 크다.
본 논문에서는 몇몇 상황에서 Robins에 의한 Structural Nested Failure Time Models(SNFTM)를 사용하여 평균 인과 효과(ACE)의 편향되지 않은 추정치를 얻는 방법을 제안했다. SNFTM은 시간에 따라 변화하고 다음 시점의 교란 변수에 영향을 미치는 처치 변수의 생존 시간에 대한 인과 효과를 추정하는 데 사용되는 모형이다.
첫째, 측정되지 않은 교란변수가 있는 SNFTM를 사용하여 인과 효과를 추정하는 방법을 제안했다. 편향되지 않은 인과 효과를 추정하려면 모든 교란변수를 측정해야 한다. 하지만 현실적으로 모든 교란변수가 관측되는 것은 거의 불가능하다. 이를 위해, 관측되지 않은 교란변수가 있을 때, 많이 사용되는 방법인 도구변수(IV) 방법을 SNFTM에 적용하였다. 도구변수 방법에서 2SRI를 사용하였다. 이 때 관측되지 않은 교란변수는 처치변수와 가법적인 관계에 있어야 하기 때문에, 잔차를 계산할 때 선형 모형을 가정하였다. 인과 효과의 추정치는 실제 인과 효과에 대한 일치추정량이 될 수 있다. 그리고 본 논문에서는 SNFTM과 도구변수 방법을 사용하여 SNFTM의 성능을 비교했다. 측정되지 않은 교란변수가 존재하는 경우 도구변수 방법을 사용한 SNFTM의 편향은 SNFTM보다 낮았다. 그리고 도구변수가 처치 변수와 큰 상관관계를 갖는 경우 모형의 표준 오차도 감소한다.
둘째, 3장에서는 SNFTM이 임의 효과를 고려하는 방법을 제안하였다. 반복 측정되는 경시적 자료에서는 개체내상관이 나타낼 수 있다. 하지만 SNFTM는 반복측정되는 시간 종속 처치 변수의 개체 내 상관을 고려하지 않는다. 따라서 SNFTM에서 로지스틱 회귀분석의 우도함수를 사용하여 추정방정식을 계산하는 것처럼, 개체 내 상관을 고려하여 GLMM을 사용한 추정식을 계산한다. 그리고 이 추정방정식도 SNFTM의 g-estimation과 마찬가지로 grid search을 사용한다. 데이터에 개체 내 상관이 없는 경우, SNFTM with RI(SNFTM with random intercept)를 사용한 SNFTM와 기존의 SNFTM의 성능에는 큰 차이가 없다. 하지만 데이터에 개체 내 상관이 있을 경우, 기존의 SNFTM의 편향은 SNFTM with RI에 비해 크다.
In this thesis, I studied how to obtain the non-biased estimates of the average causal effect(ACE) of the Structural Nested Failure Time Models(SNFTM) by Robins if there are unmeasured confounders or correlations within a subject. The SNFTM are used to estimate the causal effects on the survival tim...
In this thesis, I studied how to obtain the non-biased estimates of the average causal effect(ACE) of the Structural Nested Failure Time Models(SNFTM) by Robins if there are unmeasured confounders or correlations within a subject. The SNFTM are used to estimate the causal effects on the survival time of a treatment variable that changes over time and affects the confounding variables at the next point in time.
First, I proposed the method to estimate the causal effect using the SNFTM with the presence of unmeasured confounders. To estimate the unbiased causal effect, all confounders must be observed, but most of the data do not have sufficient numbers of observed confounders. Hence, I used the instrumental variable(IV) method on the SNFTM because it is frequently used when there are unmeasured confounders in the causal inference. With the assumption of a linear model when calculating the residuals for 2SRI(Two stage Residual Inclusion) in the IV method, the estimator of causal effect can be a consistent estimator of the true causal effect.
I compared the performance of the SNFTM using the IV method with the conventional SNFTM. When there are unmeasured confounders, the SNFTM using the IV method has a lower bias than the conventional SNFTM. If the instrumental variable has a large correlation with the treatment variables, the standard error of the model also decreases.
Second, I proposed the SNFTM considering random effects. Longitudinal data, which are repeatedly measured, likely show correlations within a subject. The time-dependent treatment variable of the SNFTM may consider the correlations within an object, but it does not consider the correlation within a subject. Therefore, I generated the estimating equation considering the correlation among the treatment variables of a subject. The estimating equation considering the correlations within a subject uses the likelihood of the GLMM(Generalized Linear Mixed Model). To solve this equation, I used a grid search same as g-estimation of the SNFTM. When the data have no correlation within a subject, the performances of the conventional SNFTM and SNFTM with RI(random intercept) do not significantly differ from each other. However, when the data have a correlation within a subject, the conventional SNFTM has a larger bias than the SNFTM with RI
In this thesis, I studied how to obtain the non-biased estimates of the average causal effect(ACE) of the Structural Nested Failure Time Models(SNFTM) by Robins if there are unmeasured confounders or correlations within a subject. The SNFTM are used to estimate the causal effects on the survival time of a treatment variable that changes over time and affects the confounding variables at the next point in time.
First, I proposed the method to estimate the causal effect using the SNFTM with the presence of unmeasured confounders. To estimate the unbiased causal effect, all confounders must be observed, but most of the data do not have sufficient numbers of observed confounders. Hence, I used the instrumental variable(IV) method on the SNFTM because it is frequently used when there are unmeasured confounders in the causal inference. With the assumption of a linear model when calculating the residuals for 2SRI(Two stage Residual Inclusion) in the IV method, the estimator of causal effect can be a consistent estimator of the true causal effect.
I compared the performance of the SNFTM using the IV method with the conventional SNFTM. When there are unmeasured confounders, the SNFTM using the IV method has a lower bias than the conventional SNFTM. If the instrumental variable has a large correlation with the treatment variables, the standard error of the model also decreases.
Second, I proposed the SNFTM considering random effects. Longitudinal data, which are repeatedly measured, likely show correlations within a subject. The time-dependent treatment variable of the SNFTM may consider the correlations within an object, but it does not consider the correlation within a subject. Therefore, I generated the estimating equation considering the correlation among the treatment variables of a subject. The estimating equation considering the correlations within a subject uses the likelihood of the GLMM(Generalized Linear Mixed Model). To solve this equation, I used a grid search same as g-estimation of the SNFTM. When the data have no correlation within a subject, the performances of the conventional SNFTM and SNFTM with RI(random intercept) do not significantly differ from each other. However, when the data have a correlation within a subject, the conventional SNFTM has a larger bias than the SNFTM with RI
Keyword
#인과추론 생존시간 관측되지 않은 교란변수 개체내상관 도구변수 causal inference SNFTM survival time unmeasured confounders random effects instrumental variables GLMM
학위논문 정보
저자
조은영
학위수여기관
고려대학교 대학원
학위구분
국내박사
학과
의학통계학협동과정 의학통계학전공
지도교수
안형진
발행연도
2019
총페이지
91장
키워드
인과추론 생존시간 관측되지 않은 교란변수 개체내상관 도구변수 causal inference SNFTM survival time unmeasured confounders random effects instrumental variables GLMM
※ AI-Helper는 부적절한 답변을 할 수 있습니다.