Fundamental Problem of Causal Inference

정의

동일한 개인에 대해 처치(W=1)와 대조(W=0)의 결과를 동시에 관측할 수 없는 문제

Holland (1986)가 공식화한 인과 추론의 핵심 문제:

“The fundamental problem of causal inference is that we can observe at most one of the potential outcomes for each unit.”

\text{ITE}_i = Y_i(1) - Y_i(0)

위 식에서 $Y_i(1)$ 과 $Y_i(0)$ 중 하나만 관측 가능.

직관적 이해

예시: 약물 효과

환자 Alice에게 약물 A를 투여했을 때의 결과만 관측 가능:

환자	약물 A 결과 (관측)	약물 미투여 결과 (반사실적)
Alice	Y=회복	? (관측 불가)

반사실적(Counterfactual) 결과:

“만약 Alice가 약물을 받지 않았다면 어떻게 되었을까?”
이 질문에 대한 답을 직접 관측할 수 없음

Missing Data 관점

인과 추론은 missing data 문제로 볼 수 있음:

Unit	W	Y(1)	Y(0)	ITE
1	1	5	?	?
2	0	?	3	?
3	1	7	?	?
4	0	?	4	?

처치군: $Y(1)$ 관측, $Y(0)$ 결측
대조군: $Y(0)$ 관측, $Y(1)$ 결측

해결 전략

1. 그룹 수준 비교 (ATE 추정)

개인 수준 ITE 대신 평균 처치 효과(ATE) 추정:

\text{ATE} = E[Y(1)] - E[Y(0)]

가정 하에서 관측 데이터로부터 추정 가능.

2. 핵심 가정 활용

세 가지 핵심 가정 만족 시 식별 가능:

SUTVA
Ignorability
Positivity

3. Matching / Weighting

유사한 개인 비교를 통해 반사실적 결과 추론:

Propensity Score Matching: 유사한 성향의 개인 매칭
IPW: 가중치로 그룹 분포 균형

4. 모델 기반 추정

잠재 결과를 예측 모델로 추정:

T-Learner: 각 처치 그룹별 outcome 모델
S-Learner: 통합 모델로 처치 효과 추정

RCT vs 관측 연구

RCT (Randomized Controlled Trial)

무작위 배정으로 Ignorability 자동 만족:

W \perp\!\!\!\perp (Y(0), Y(1))

처치/대조군의 평균 비교로 ATE 추정 가능
“Gold standard” for causal inference

관측 연구 (Observational Study)

무작위 배정 없음 → 추가 가정 필요:

Conditional ignorability: $W \perp\!\!\!\perp (Y(0), Y(1)) \mid X$
공변량 조정 필요

왜 중요한가?

예측 ≠ 인과
- 예측: “X가 주어졌을 때 Y는?”
- 인과: “X를 바꾸면 Y가 어떻게 변할까?”
개입(Intervention)의 효과
- 정책, 치료, 마케팅 등 의사결정에 필수
반사실적 사고(Counterfactual Thinking)
- “다르게 했다면?” 질문에 답하는 능력

참고 논문

Holland, P. W. (1986). Statistics and Causal Inference. JASA
yaoSurveyCausalInference2021 - Section 2.5
Potential Outcomes - Rubin (1974) framework