Back-door Criterion
Definition
Back-door Criterion (Pearl, 1993)은 observational data에서 causal effect를 식별하기 위한 graphical criterion. 변수 집합 가 의 causal effect 식별에 충분한지 판단.
Formal Definition:
변수 집합 가 에 대해 back-door criterion을 만족하는 조건:
- 의 어떤 변수도 의 descendant가 아님
- 가 와 를 연결하는 모든 back-door path를 차단
Back-door Path
Back-door path: 에서 로 가는 path 중, 로 들어오는 화살표로 시작하는 path
X ← ... → Y (back-door path)
X → ... → Y (front-door path, causal path)
예시:
Z
↙ ↘
X Y
- Back-door path:
- 이 path를 통해 non-causal association 전달
Intuitive Understanding
핵심 아이디어:
Causal effect = Total association - Spurious association (via back-door)
Total association between X and Y:
1. Causal path: X → ... → Y
2. Back-door paths: X ← ... → Y (spurious)
Back-door criterion: 2를 차단하여 1만 남김
비유:
- 앞문(front-door): X가 Y에 영향을 주는 경로 (인과)
- 뒷문(back-door): X와 Y가 공통 원인을 통해 연결되는 경로 (비인과)
- 뒷문을 모두 닫으면 → 인과 효과 식별 가능
Back-door Adjustment Formula
가 back-door criterion을 만족하면:
또는 연속형:
의미:
- 를 condition하고 평균을 내면 causal effect 얻음
- Observational data로 interventional distribution 계산 가능
Algorithm: Finding Adjustment Sets
Step 1: 모든 Back-door Path 나열
에서 시작하여 로 들어오는 화살표를 따라가며 에 도달하는 모든 path
Step 2: 각 Path 차단 방법 결정
- Fork (X ← Z → Y): Z를 condition하면 차단
- Chain (… → Z → …): Z를 condition하면 차단
- Collider (…→ Z ←…): Z를 condition하지 않으면 차단 (이미 차단됨)
Step 3: Adjustment Set 선택
- 모든 back-door path를 차단하는 변수 집합
- 의 descendant 포함하지 않음
Examples
Example 1: Simple Confounding
Z
↙ ↘
X → Y
Back-door path: Adjustment set: Formula:
Example 2: Multiple Confounders
Z1 Z2
↘ ↙ ↘
X → Y
Back-door paths:
- (없음, Z1→Y 직접 없다면)
- …
Adjustment set: 상황에 따라 , , 또는
Example 3: Collider on Back-door Path
Z1 → C ← Z2
↓ ↓
X → Y
Back-door path:
- C가 collider → path 이미 차단됨!
- Adjustment set: (아무것도 control 안 해도 됨)
주의: C를 control하면 path가 열림 → bias 발생
Example 4: Mediator
Z
↓
X → M → Y
Causal path: Back-door path: 없음 (Z가 X만 영향)
로 adjust해도 되고 안 해도 됨 (back-door 없으므로)
주의: M을 adjust하면 안 됨 (front-door path 차단)
Sufficient vs Minimal Adjustment Sets
Sufficient Adjustment Set
- Back-door criterion을 만족하는 모든 집합
Minimal Adjustment Set
- Sufficient 중 가장 작은 집합
- 불필요한 변수 포함하지 않음
Trade-off:
- 더 많은 변수: 더 robust (누락된 confounding 방지)
- 더 적은 변수: 더 efficient (variance 감소)
Limitations
- DAG 정확성 의존: DAG가 틀리면 결론도 틀림
- Unmeasured confounders: 측정되지 않은 변수가 있으면 차단 불가
- Sufficient but not necessary: Back-door criterion은 충분조건이지 필요조건 아님
Related Criteria
Front-door Criterion
X → M → Y
↑
U (unobserved confounder)
- Back-door 차단 불가할 때 대안
- Mediator를 활용한 identification
Instrumental Variables
- Back-door 차단 불가할 때 대안
- Instrument → X → Y 구조 활용
Related Concepts
- DAG - Causal structure 시각화
- Confounder - Back-door path 생성
- Collider - Back-door path 차단
- d-separation - DAG에서 conditional independence
- Propensity Score - Back-door adjustment 구현
- Unconfoundedness - No unmeasured confounders
References
- Pearl, J. (1993). Comment: Graphical models, causality and intervention
- Pearl, J. (2009). Causality: Models, Reasoning, and Inference
- rohrerThinkingClearlyCorrelations - Back-door criterion 소개