Tae Hyun Kim (Lowell)

ATT (Average Treatment Effect on the Treated)

3분 읽기 #causal-inference#potential-outcomes

정의

실제로 처치를 받은 그룹에 대한 평균 처치 효과

ATT=E[Y(1)Y(0)W=1]\text{ATT} = E[Y(1) - Y(0) \mid W=1]

분해하면:

ATT=E[Y(1)W=1]E[Y(0)W=1]\text{ATT} = E[Y(1) \mid W=1] - E[Y(0) \mid W=1]
  • 첫째 항: 처치군의 관측 결과 (직접 추정 가능)
  • 둘째 항: 처치군의 반사실적 결과 (추정 필요)

직관적 이해

ATE vs ATT

Estimand질문
ATE”전체 인구에 처치를 적용하면 평균 효과는?”
ATT”처치를 받은 사람들에게 처치가 효과적이었나?”

언제 ATT를 사용하나?

  1. 정책 평가: 기존 프로그램 참여자에 대한 효과
  2. 비용 편익 분석: 실제 처치 대상에 대한 효과
  3. Self-selection 상황: 처치 선택자의 효과가 관심

ATE와 ATT의 관계

수학적 관계

ATE=P(W=1)ATT+P(W=0)ATC\text{ATE} = P(W=1) \cdot \text{ATT} + P(W=0) \cdot \text{ATC}

여기서:

ATC=E[Y(1)Y(0)W=0]\text{ATC} = E[Y(1) - Y(0) \mid W=0]

언제 ATE = ATT?

Homogeneous treatment effects 하에서:

Y(1)Y(0)=τ(상수)Y(1) - Y(0) = \tau \quad \text{(상수)}

이 경우 ATE=ATT=ATC=τ\text{ATE} = \text{ATT} = \text{ATC} = \tau.

ATE ≠ ATT인 경우

이질적 효과 + Self-selection:

  • 효과가 클 것으로 예상되는 사람이 처치 선택
  • ATT>ATC\text{ATT} > \text{ATC}
  • ATT>ATE\text{ATT} > \text{ATE}

예시: 직업 훈련 프로그램

  • 동기가 높은 사람이 참여
  • 이들에게 효과도 더 큼
  • → ATT가 ATE보다 큼

식별 (Identification)

Strong Ignorability 하에서

ATT=EX[E[YW=1,X]E[YW=0,X]W=1]\text{ATT} = E_X\left[E[Y \mid W=1, X] - E[Y \mid W=0, X] \mid W=1\right]

IPW-ATT

ATT^IPW=1n1i:Wi=1Yi1n1i:Wi=0e(Xi)1e(Xi)Yi\hat{\text{ATT}}_{IPW} = \frac{1}{n_1} \sum_{i: W_i=1} Y_i - \frac{1}{n_1} \sum_{i: W_i=0} \frac{e(X_i)}{1-e(X_i)} Y_i

여기서 n1=iWin_1 = \sum_i W_i.

Matching for ATT

처치군의 각 개인에 대해 유사한 대조군 매칭:

  1. 처치군 ii에 대해 유사한 대조군 jj 찾기
  2. τ^i=YiYj\hat{\tau}_i = Y_i - Y_j
  3. ATT^=1n1i:Wi=1τ^i\hat{\text{ATT}} = \frac{1}{n_1} \sum_{i: W_i=1} \hat{\tau}_i

ATT 추정 방법

1. IPW for ATT

ATT^=iWiYiiWii(1Wi)e(Xi)1e(Xi)Yii(1Wi)e(Xi)1e(Xi)\hat{\text{ATT}} = \frac{\sum_{i} W_i Y_i}{\sum_i W_i} - \frac{\sum_i (1-W_i) \frac{e(X_i)}{1-e(X_i)} Y_i}{\sum_i (1-W_i) \frac{e(X_i)}{1-e(X_i)}}

2. Matching

Propensity Score Matching, Nearest Neighbor Matching

3. Doubly Robust for ATT

ATT^DR=1n1i:Wi=1[Yiμ^0(Xi)(1Wi)(Yiμ^0(Xi))1e(Xi)e(Xi)P(W=1)]\hat{\text{ATT}}_{DR} = \frac{1}{n_1}\sum_{i: W_i=1} \left[Y_i - \hat{\mu}_0(X_i) - \frac{(1-W_i)(Y_i - \hat{\mu}_0(X_i))}{1-e(X_i)} \cdot \frac{e(X_i)}{P(W=1)}\right]

ATC와의 비교

Estimand정의해석
ATTE[Y(1)Y(0)W=1]E[Y(1)-Y(0) \mid W=1]처치 받은 이들에게 효과
ATCE[Y(1)Y(0)W=0]E[Y(1)-Y(0) \mid W=0]처치 안 받은 이들에게 (가상) 효과

왜 ATT ≠ ATC?

이질성(Heterogeneity):

  • 처치 효과가 특성에 따라 다름
  • 처치 선택이 효과와 관련

관련 개념


참고 논문

  • yaoSurveyCausalInference2021 - Section 2.2
  • Imbens, G. W. (2004). Nonparametric estimation of average treatment effects under exogeneity
  • Heckman, J. J., et al. (1997). Matching as an econometric evaluation estimator

연결 그래프