Tae Hyun Kim (Lowell)

Mediator

3분 읽기 #causal-inference#scm#mediation#dag

Definition

Mediator는 treatment (X)가 outcome (Y)에 영향을 주는 causal pathway 상에 있는 중간 변수. X → M → Y 구조에서 M이 mediator.

DAG 표현:

  Treatment (X) → Mediator (M) → Outcome (Y)

핵심 특성:

  • X의 효과 일부 또는 전부가 M을 통해 Y에 전달
  • M을 control하면 genuine causal effect를 차단

Total, Direct, and Indirect Effects

        X → M → Y     (Indirect effect: through M)
        X ----→ Y     (Direct effect: not through M)

Total Effect (TE)

TE=E[Ydo(X=1)]E[Ydo(X=0)]TE = E[Y|do(X=1)] - E[Y|do(X=0)]

  • X가 Y에 미치는 전체 효과
  • Direct + Indirect effect

Direct Effect (DE)

DE=E[Ydo(X=1,M=m)]E[Ydo(X=0,M=m)]DE = E[Y|do(X=1, M=m)] - E[Y|do(X=0, M=m)]

  • M을 고정했을 때 X → Y 효과
  • M을 거치지 않는 경로

Indirect Effect (IE)

IE=TEDEIE = TE - DE

  • M을 통한 X → Y 효과
  • “Mediated effect”

Why NOT Control for Mediators?

Problem 1: Underestimation of Total Effect

M을 control하면:

  • Indirect effect (X → M → Y)가 차단됨
  • Total effect를 과소평가
원래: X ---(direct)--> Y
      X ---(via M)---> Y   ← 이 부분이 사라짐

Problem 2: Endogenous Selection Bias

Mediator가 confounder와 연결되어 있을 때:

      U (unmeasured)
     ↙        ↘
    M          Y

    X

M을 control하면:

  • X와 U 사이에 spurious association 생성 (M이 collider가 됨)
  • Bias 도입

Example: Education → Adult Intelligence → Income

                    Childhood Intelligence
                        ↙        ↘
Education → Adult Intelligence → Income
     ↘_________________________↗
  • Without control: Education의 total effect on Income
  • With control for Adult Intelligence:
    1. Indirect effect 차단 (과소평가)
    2. Childhood Intelligence가 U 역할 → bias

When to Control for Mediator?

Goal: Estimate Total Effect

→ Do NOT control for mediator

Goal: Estimate Direct Effect Only

→ Control for mediator (주의 필요)

하지만:

  • Direct effect 추정은 추가 가정 필요
  • M이 randomized되지 않으면 bias 가능
  • Experimental study에서도 M을 randomize해야 valid

Mediation Analysis

Traditional mediation (Baron & Kenny, 1986):

  • Limitations 많음
  • Causal interpretation 어려움

Modern causal mediation (Imai et al., 2010; Pearl):

  • Sequential ignorability 가정
  • 더 엄격한 identification 조건

Mediator vs Confounder vs Collider

변수 유형DAG 구조Control 효과
ConfounderX ← Z → YSpurious association 제거 ✓
ColliderX → C ← YSpurious association 생성 ✗
MediatorX → M → YCausal effect 차단 ✗

공통점 (Collider & Mediator): 둘 다 post-treatment variable

Identifying Mediators

Temporal Criterion

  • Treatment 이후, Outcome 이전에 발생
  • Treatment에 의해 영향받음

Causal Pathway

  • X → M: X가 M에 영향
  • M → Y: M이 Y에 영향
  • M이 X→Y 경로 상에 위치

Example Mediators

TreatmentMediatorOutcome
EducationSkills/KnowledgeIncome
TherapyCoping mechanismsDepression
DrugBiological pathwayHealth outcome
ExerciseFitness levelWeight loss

Partial vs Full Mediation

Full Mediation

X → M → Y   (only through M)
  • X의 모든 효과가 M을 통해
  • Direct effect = 0

Partial Mediation

X → M → Y
X ---→ Y   (also direct effect)
  • X의 일부 효과가 M을 통해
  • Direct effect ≠ 0

Post-treatment Variable Rule

Rule of Thumb:

Treatment 이후에 발생하는 변수는 control하지 말 것

이유:

  1. Mediator: Causal effect 차단
  2. Collider: Spurious association 생성
  3. Descendant of collider: 간접적 collider bias

예외:

  • Direct effect 추정이 명확한 목표일 때
  • 적절한 causal mediation analysis 사용
  • DAG - Causal structure 시각화
  • Confounder - Common cause (control 해야 함)
  • Collider - Common effect (control하면 안 됨)
  • CATE - Treatment effect estimation
  • Causal Mediation Analysis - Mediation 효과 분석

References

  • rohrerThinkingClearlyCorrelations - Mediator control의 위험성
  • Baron, R. M., & Kenny, D. A. (1986). The moderator-mediator variable distinction
  • Pearl, J. (2014). Interpretation and identification of causal mediation
  • Imai, K., et al. (2010). A general approach to causal mediation analysis

연결 그래프