Fundamental Problem of Causal Inference
정의
동일한 개인에 대해 처치(W=1)와 대조(W=0)의 결과를 동시에 관측할 수 없는 문제
Holland (1986)가 공식화한 인과 추론의 핵심 문제:
“The fundamental problem of causal inference is that we can observe at most one of the potential outcomes for each unit.”
위 식에서 과 중 하나만 관측 가능.
직관적 이해
예시: 약물 효과
환자 Alice에게 약물 A를 투여했을 때의 결과만 관측 가능:
| 환자 | 약물 A 결과 (관측) | 약물 미투여 결과 (반사실적) |
|---|---|---|
| Alice | Y=회복 | ? (관측 불가) |
반사실적(Counterfactual) 결과:
- “만약 Alice가 약물을 받지 않았다면 어떻게 되었을까?”
- 이 질문에 대한 답을 직접 관측할 수 없음
Missing Data 관점
인과 추론은 missing data 문제로 볼 수 있음:
| Unit | W | Y(1) | Y(0) | ITE |
|---|---|---|---|---|
| 1 | 1 | 5 | ? | ? |
| 2 | 0 | ? | 3 | ? |
| 3 | 1 | 7 | ? | ? |
| 4 | 0 | ? | 4 | ? |
- 처치군: 관측, 결측
- 대조군: 관측, 결측
해결 전략
1. 그룹 수준 비교 (ATE 추정)
개인 수준 ITE 대신 평균 처치 효과(ATE) 추정:
가정 하에서 관측 데이터로부터 추정 가능.
2. 핵심 가정 활용
세 가지 핵심 가정 만족 시 식별 가능:
- SUTVA
- Ignorability
- Positivity
3. Matching / Weighting
유사한 개인 비교를 통해 반사실적 결과 추론:
- Propensity Score Matching: 유사한 성향의 개인 매칭
- IPW: 가중치로 그룹 분포 균형
4. 모델 기반 추정
잠재 결과를 예측 모델로 추정:
RCT vs 관측 연구
RCT (Randomized Controlled Trial)
무작위 배정으로 Ignorability 자동 만족:
- 처치/대조군의 평균 비교로 ATE 추정 가능
- “Gold standard” for causal inference
관측 연구 (Observational Study)
무작위 배정 없음 → 추가 가정 필요:
- Conditional ignorability:
- 공변량 조정 필요
왜 중요한가?
-
예측 ≠ 인과
- 예측: “X가 주어졌을 때 Y는?”
- 인과: “X를 바꾸면 Y가 어떻게 변할까?”
-
개입(Intervention)의 효과
- 정책, 치료, 마케팅 등 의사결정에 필수
-
반사실적 사고(Counterfactual Thinking)
- “다르게 했다면?” 질문에 답하는 능력
관련 개념
- Potential Outcomes - Rubin Causal Model
- Causal Assumptions Overview - 가정들의 통합 정리
- Counterfactual Reasoning - 반사실적 추론
- Selection Bias - 처치/대조군 차이로 인한 편향
- ITE - Individual Treatment Effect
참고 논문
- Holland, P. W. (1986). Statistics and Causal Inference. JASA
- yaoSurveyCausalInference2021 - Section 2.5
- Potential Outcomes - Rubin (1974) framework