$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 비실험 자료로부터의 인과 추론: 핵심 개념과 최근 동향
Causal inference from nonrandomized data: key concepts and recent trends 원문보기

응용통계연구 = The Korean journal of applied statistics, v.32 no.2, 2019년, pp.173 - 185  

최영근 (SK텔레콤 Data 기술원) ,  유동현 (인하대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

과학적 연구에서 핵심적인 연구 주제 또는 가설은 대부분 인과적 질문(causal question)을 포함한다. 예를 들어, 전염병 예방을 위한 치료법의 효과 연구, 특정 정책의 시행으로 인한 효용(utility)의 평가에 대한 연구, 특정 사용자를 대상으로 노출된 광고의 종류에 따른 광고의 효과성에 대한 연구는 모두 인과 관계(causal relationship)의 추론이 요구된다. 이러한 인과 관계를 다루는 통계적 인과 추론(statistical causal inference)의 주요 관심사 중 하나는 모집단에 일종의 개입(정책 혹은 처치)을 적용한 후 개입의 효과를 정확하게 추정하는 것이다. 인과 추론은 임상실험과 정책결정에서 주로 이용되었으나, 이른바 빅데이터 시대의 도래로 가용한 관측자료가 폭발적으로 증가하였고 이로 인하여 인과 추론에 대한 잠재적 응용가치와 수요가 지속적으로 증가하고 있다. 하지만 가용한 대부분의 자료는 임의실험 기반의 자료와 달리 개입이 임의로 분배되지 않은 비실험 관측자료이다. 따라서, 본 논문은 비실험 관측자료로부터 개입의 효과를 추정하기 위한 인과 추론의 핵심 개념과 최근의 연구동향을 소개하고자 한다. 이를 위하여 본문에서는 먼저 개입의 효과를 Neyman-Rubin의 잠재 결과(potential outcome) 모형으로 나타내고, 개입의 효과를 추정하는 여러 접근법 중 특히 성향점수(propensity score) 기반 추정법과 회귀모형 기반 추정법을 중점적으로 소개한다. 최근 연구동향으로는 (1) 평균 효과 크기 추정을 넘어선 개인별 효과 크기의 추정, (2) 효과크기 추정에 있어서 자료 규모의 증대로 인한 차원의 저주가 야기하는 난제들과 이에 대한 해결방안들, (3) 복합적 인과관계를 반영하기 위한 Pearl의 구조적 인과 모형(structural causal model) 및 잠재 결과 모형과의 비교의 3가지 주제로 구분하여 소개한다.

Abstract AI-Helper 아이콘AI-Helper

Causal questions are prevalent in scientific research, for example, how effective a treatment was for preventing an infectious disease, how much a policy increased utility, or which advertisement would give the highest click rate for a given customer. Causal inference theory in statistics interprets...

Keyword

표/그림 (1)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 종설논문의 목적은 관찰자료로부터의 인과적 추론을 위한 핵심적 개념틀과 최근 연구 동향을 소개하는 데 있다. 본 논문의 구성은 다음과 같다.
  • 쉬운 예제를 통하여 인과모형을 방향성 비순환 그래프로 나타내고 개입의 효과를 do-계산법으로 나타내는 방법을 알아보자. 먼저 다음과 같은 함수 관계는 Figure 4.
  • 본 절에서는 간단한 가상실험 데이터를 생성하여 (조건부) 평균처치효과 추정량들을 직접 계산하고 비교하여 본다. 먼저 아래와 같이 X, A, Y 를 생성하자.
  • 통계적 인과 추론의 목표는 인간의 인위적인 개입에 대한 효과를 정확하게 추정하는 것이다. 임의실험이 아닌 관찰자료로부터 효과를 측정하기 위하여는 관찰자료 자체에서는 검증할 수 없는 가정을 하는 점에서 근본적인 한계가 있으나, 임의실험이 윤리적으로 불가능하거나 고비용을 소모하는 상황에서도 개입의 효과를 측정하기 위한 개념틀을 제공한다는 점에서 유용하다.

가설 설정

  • 위 셋을 Bayes 정리와 조합하면, 아래와 같이 계산이 가능하다(편의상 이산확률변수를 가정하였다).
  • (X, A, Y)는 알려지지 않은 분포 P를 따를 때, 우리는 확률표본 #를 관찰하였다고 가정한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
인과 추론에서 발생하는 차원의 저주를 직관적으로 말하면? 인과 추론에서도 차원의 저주는 여전히 발생한다. 직관적으로는, 가능한 모든 종류의 교란변수를 공변량 X에 포함하면 무시가능성 가정을 만족시킬 가능성이 더 높아질 수도 있다. 문제는 양수성 가정의 위반인데, 공변량의 차원이 증가할수록 단위 개체의 근접 이웃 개체들을 찾기가 힘들게 되고, 따라서 어떤 공변량 x0에 대하여 P(A = 1|X0 = x0) = 1 또는 0일 가능성이 더 커지게 된다.
임의실험은 어떤 방법이었는가? Fisher RA가 실험계획법을 체계화한 이래로, 인과관계를 규명하는 가장 확실한 방법은 임의실험이었다. 하지만 현실에서 다루게 되는 대부분의 자료는 임의실험보다는 비실험 관찰로 수집된 자료이고, 이에 대한 인과성 추론을 위한 이론 개발이 요구되었다.
인과성 추론이 발전하게 된 계기는? 하지만 현실에서 다루게 되는 대부분의 자료는 임의실험보다는 비실험 관찰로 수집된 자료이고, 이에 대한 인과성 추론을 위한 이론 개발이 요구되었다. 비실험 관찰자료로부터의 인과성 추론은 흡연과폐암의 인과관계 논쟁에서 급격하게 발전하였다 (Cornfield 등, 2009). 특히 Rubin D와 그의 연구 그룹은 1970년대 이래로 관찰자료로부터의 인과적 효과의 측정을 가능케 하는 개념틀을 확립하여 왔다(자세한 종설은 Rubin (2005)에서 확인할 수 있다).
질의응답 정보가 도움이 되었나요?

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로