$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 인과연구에서 중첩편향을 제거하기 위한 공변량선택기준
Covariate selection criteria for controlling confounding bias in a causal study 원문보기

응용통계연구 = The Korean journal of applied statistics, v.29 no.5, 2016년, pp.849 - 858  

(숭실대학교 정보통계보험수리학과) ,  김지현 (숭실대학교 정보통계보험수리학과)

초록
AI-Helper 아이콘AI-Helper

관측 자료를 이용한 인과연구에서 관심 있는 처리변수의 효과가 다른 공변량의 효과와 중첩되지 않도록 조건화할 공변량을 선택하는 것이 중요하다. 인과연구에서의 공변량선택 문제는 공분산분석 모형에서의 변수선택 문제와 다르다는 것을 예를 들어 설명하였다. 그리고 모든 변수들 사이의 인과관계를 파악하지 않고도 적용할 수 있는 실용적인 공변량선택기준에 대해 살펴보았다. VanderWeele과 Shpitser (2011)가 새로운 기준을 제안하면서 새로운 기준이 다른 두 기준보다 나은 성능을 보인다고 주장하였는데, 이 기준에도 한계와 단점이 있음을 예증하였다. 새로운 기준이 완전한 기준은 아니지만 조건을 조금 수정하면 다른 두 기준과 달리 중첩을 제거할 수 있다는 점에서 좀 더 나은 기준이라고 할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

It is important to control confounding bias when estimating the causal effect of treatment in an observational study. We illustrated that the covariate selection in the causal inference is different from the variable selection in the ANCOVA model. We then investigated the three criteria of covariate...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 하지만 이 새로운 기준에도 결함과 제한이 있음을 이 연구를 통해 보이고자 한다. 그리고 기존에 통용되고 있는 선택기준들도 나름의 장점을 가진다는 것도 보이고자 한다. 관측연구의 인과추론에서 공변량선택 방법이 중요한 주제인 만큼 실용적으로 적용할 수 있는 공변량선택기준의 한계와 적용 시 주의할 점을 정확하게 인식할 필요가 있다.
  • 반면에 인과추론이 목적인 경우 어떻게 처리효과를 중첩되지 않게 추정할 수 있는가 하는 기준에서 공변량을 선택하므로 두 선택기준의 목적이 다르다. 따라서 인과추론을 하고자 하는 경우 공분산분석 모형의 일반적인 변수선택기준으로 공변량을 선택하면 중첩을 제거하지 못하게 되는 경우가 발생하는데, 이 사실을 예로써 입증하고자 한다.
  • 하지만 공변량 C는 처리변수 A와 반응변수 Y 둘 다와 관련성(association)이 있으므로 공분산분석 모형에서 통상적인 변수선택을 하면 A와 함께 모형에 포함되어야 할 공변량으로 잘못 선택된다. 모의실험으로 이를 확인해보자.
  • 을 생성된 자료에 각각 적합시켰다. 이 모의실험의 목적은 처리효과 추정량의 표준오차의 크기 비교에 있으므로 표본크기를 200으로 줄였다. 그리고 500번의 반복실험에서 매번 추정량의 표준오차를 구하였다.
  • 이 연구에서 논의한 세 가지 기준은 변수들 사이의 인과관계를 모두 파악하지는 못하고 공변량과 처리변수, 그리고 공변량과 반응변수와의 인과관계만 알고 있는 경우에 적용할 수 있는 실용적 기준이다. 이 실용적 기준들의 한계와 적용 시 주의할 점을 지적하여 관측연구의 인과추론 을 위해 공변량을 선택해야 하는 문제에 직면한 연구자에게 도움을 주고자 하였다.
  • 관측연구의 인과추론에서 공변량선택 방법이 중요한 주제인 만큼 실용적으로 적용할 수 있는 공변량선택기준의 한계와 적용 시 주의할 점을 정확하게 인식할 필요가 있다. 이 연구를 통해 그런 점들을 지적하고자 한다.
  • C1은 뒷문경로 상에 있지 않으므로 조건화할 필요가 없는 변수인데 조건화한다고 해서 편향을 가져오지는 않는다. 하지만 반응변수와 무관한 변수를 조건화하면 처리효과의 추정량의 표준오차를 크게 하는 경향이 있다고 알려져 있는데, 이를 모의실험을 통해 확인하고자 한다. 자료 생성 모형은 다음과 같다.

가설 설정

  • 관측연구의 인과추론에서 처리효과에 대한 비편향추정량을 얻을 수 있는 조건을 서술한 Pearl (1993)의 정리는 인과 그래프를 그릴 수 있다는 것을 가정한다. 인과 그래프는 처리변수와 반응변수, 그리고 공변량들 사이의 인과관계를 나타낸 그래프인데, 중요한 용어들을 Greenland 등 (1999)을 참조하여 정리하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
관측 자료를 이용해 인과연구(causal study)를 하고자 할 때 중요한 것은 무엇인가? 확률화(randomization)가 이루어진 실험 자료가 아닌 관측 자료를 이용해 인과연구(causal study)를 하고자 할 때 처리효과(treatment effect)를 제대로 추정하기 위해 조건화해야 할 변수들을 선택하는 문제는 매우 중요하다. LaLonde (1986)의 예에서와 같이 직업훈련 프로그램 이수 여부가 소득 향상에 미치는 효과를 추정하고자 할 때 프로그램 이수 여부를 피실험자가 선택(self-selection)하므로 프로그램을 이수한 집단과 하지 않은 집단의 특성, 예를 들어 교육수준이나 나이 등의 특성이 다르게 되는데, 이러 한 특성의 차이에 대한 고려 없이 단순히 프로그램을 이수한 집단과 이수하지 않은 집단의 평균 소득의 차이만으로 교육의 효과를 추정하면 편향된 추정량을 얻게 된다.
처리변수란 무엇인가? 직업훈련 프로그램의 이수 여부와 같이 그 인과효과(causal effect)를 알고 싶은 변수를 처리변수라고 하고, 소득과 같이 비교하고 싶은 크기를 나타내는 변수를 반응변수라고 하자. 이 두 변수 이외에 관측되는 변수들을 공변량(covariates 또는 concomitant variables)이라고 할 때, 처리효과의 비편향 추정량을 얻기 위해 조건화해야 하는 공변량들을 선택하는 방법 또는 기준이 중요하다.
회귀분석 또는 공분산분석에 사용되는 변수선택기준이 인과연구에 사용하기 적합하지 않은 이유는 무엇인가? 이 두 변수 이외에 관측되는 변수들을 공변량(covariates 또는 concomitant variables)이라고 할 때, 처리효과의 비편향 추정량을 얻기 위해 조건화해야 하는 공변량들을 선택하는 방법 또는 기준이 중요하다. 반응변수에 관한 모형에서 변수를 선택할 때는 모형에 의한 예측값이 관측값에 얼마나 가까운가를 보는 것이고, 인과연구에서 변수를 선택할 때는 어떻게 하면 처리효과를 편향되지 않게 추정할 수 있을까를 보는 것이기 때문에 변수를 선택하는 목적이 다르다. 따라서 회귀분석 또는 공분산분석(analysis of covariance; ANCOVA) 모형에서 쓰이는 변수선택기준은 인과연구에서 처리효과를 제대로 추정하기 위한 공변량선택기준으로 적합하지 않다.
질의응답 정보가 도움이 되었나요?

참고문헌 (9)

  1. Greenland, S., Pearl, J., and Robins, J. M. (1999). Causal diagrams for epidemiologic research, Epidemiology, 10, 37-48. 

  2. LaLonde, R. J. (1986). Evaluating the econometric evaluations of training programs with experimental data, American Economic Review, 76, 604-620. 

  3. Pearl, J. (1993). Comment: graphical models, causality, and intervention, Statistical Science, 8, 266-269. 

  4. Pearl, J. (1995). Causal diagrams for empirical research, Biometrika, 82, 669-688. 

  5. Pearl, J. (2009). Causality: Models, Reasoning, and Inference, Cambridge University Press, Cambridge. 

  6. Rubin, D. B. (1974). Estimating causal effects of treatments in randomized and nonrandomized studies, Journal of Educational Psychology, 66, 688-701. 

  7. Rubin, D. B. (1990). Formal modes of statistical inference for causal effects, Journal of Statistical Planning and Inference, 25, 279-292. 

  8. Rubin, D. B. (2009). Author's reply (to Pearl's, Arvid's and Sjolander's letters to the editor), Statistics in Medicine, 28, 1420-1423. 

  9. VanderWeele, T. J. and Shpitser, I. (2011). A new criterion for confounder selection, Biometrics, 67, 1406-1413. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로