Causal Inference
CATE · counterfactual · causal discovery · SCM · semiparametric · partial ID
무엇이 무엇을 일으키는가 — heterogeneous treatment effects와 counterfactual을, structural causal models·semiparametric estimation·unobserved confounding 하 sensitivity/partial identification으로 식별한다.
노트 51개
-
Dunnhumby — Track 2: Causal Targeting via Heterogeneous Treatment Effects
Meta-learner / Causal Forest CATE under severe positivity violation (PS AUC 0.989); an OPE-validated policy targets ~31% of customers and surfaces counter-intuitive negative-CATE segments. Hypothesis-generating on public data.
-
Applied Causal Inference for Pricing — CATE & SCM Across Public Datasets
An applied case study using only public datasets (LendingClub, iPinYou) that combines CATE estimation for price-sensitivity heterogeneity with SCM-based moderator analysis to design individual-level, risk-based pricing and RTB bidding policies — all findings illustrative and projected, not proprietary.
-
Causal Inference Under Partial Identification — Sensitivity and Evidence Hierarchies
When real-world data fail strong ignorability, point identification gives way to bounds, proxies, and sensitivity analysis — an honest hierarchy of evidence that connects credible causal claims to semiparametric efficiency.
-
From Estimation to Action — How HTE Drives Personalized Policy Across Domains
One methodological spine — estimate heterogeneous treatment effects and turn them into individual-level policies — powers both clinical sequential treatment decisions and industrial targeting, pricing, and recommendation.
-
Marketing Attribution at Scale — From Simulation to Causal Inference
A case study comparing 10+ multi-touch attribution methods against a known-ground-truth simulator, then scaling them on the public Criteo dataset, closing the loop with budget off-policy evaluation for channel allocation.
-
Anytime-Valid Inference Overview
고정 표본 가설검정의 "peeking" 문제를 푸는 game-theoretic statistics. 식별-타당성 drift를 실시간 모니터링하는 안전 추론의 수학적 기초.
-
Efficient Influence Function
(준)모수 모형의 regular asymptotically linear(RAL) 추정량들 중, 분산이 가장 작은 IF가 efficient influence function(EIF)이며 그 분산은 semiparametric efficiency bound(모든 parametric submodel의 Cramér-Rao…
-
Influence Function
함수형 모수 $\psi:\mathcal{P}\to\mathbb{R}$의 추정량 $\hat\psi$이 asymptotically linear이면 영향함수(IF) $\phi$가 존재하여
-
Negative Control Outcome (NCO)
NCO는 처치의 인과적 영향을 받지 않는다고 사전 보장되지만 같은 교란 $U$의 그림자를 받는 결과변수. 대조적으로 NCE(negative control exposure)는 결과에 인과효과가 없는 노출. NCO에 대한 "겉보기 효과"가 0이 아니면 → 비관측 교란의 신호(탐지) → proximal로 보정.
-
One-step Estimator
플러그-인 $\psi(\hat P)$에 추정된 EIF의 경험평균을 더해 1차 편향을 교정:
-
Partial Identification
점식별(point identification)이 가정 부족으로 불가능할 때, 모수는 데이터 + 가정과 양립하는 identified set $\ThetaI$(흔히 구간 $[\thetaL,\thetaU]$)에만 속함을 안다. Manski의 무가정/worst-case bounds가 출발점. sharp bounds =…
-
Proximal Causal Inference
비관측 교란 $U$가 있을 때, 두 종류의 proxy로 인과효과를 식별:
-
TMLE (Targeted Maximum Likelihood Estimation)
플러그-인 추정량을 표적 모수 방향으로 보정(targeting) 하는 절차:
-
ESCM² (Entire Space Counterfactual Multi-Task Model)
ESMM의 두 가지 이론적 한계 — Inherent Estimation Bias (IEB)와 Potential Independence Priority (PIP) — 를 해결하기 위해, Inverse Propensity Score (IPS) 및 Doubly Robust Estimator 기반…
-
AIPW (Augmented Inverse Probability Weighting)
- $\hat{\mu}t(X)$: Outcome 모델 ($E[Y|T=t, X]$)
-
ATT (Average Treatment Effect on the Treated)
실제로 처치를 받은 그룹에 대한 평균 처치 효과
-
Back-door Criterion
Back-door Criterion (Pearl, 1993)은 observational data에서 causal effect를 식별하기 위한 graphical criterion. 변수 집합 $Z$가 $X \rightarrow Y$의 causal effect 식별에 충분한지 판단.
-
BART (Bayesian Additive Regression Trees)
여러 트리의 합으로 결과를 모델링하는 Bayesian 앙상블 방법
-
CATE (Conditional Average Treatment Effect)
Conditional Average Treatment Effect (CATE)는 covariate $X=x$가 주어졌을 때의 평균 처치 효과:
-
Causal Forest
Causal Forest는 Athey, Tibshirani, Wager (2019)가 제안한 일반화 랜덤 포레스트(GRF)의 인과추론 응용으로, 처리 효과의 이질성을 최대화하도록 분할합니다.
-
CEVAE (Causal Effect Variational Autoencoder)
VAE를 활용하여 잠재 교란변수를 추론하고 인과 효과를 추정하는 방법
-
CFR (Counterfactual Regression)
IPM(Integral Probability Metric) 정규화로 균형 잡힌 표현을 학습하는 딥러닝 방법
-
Collider
Collider는 treatment (X)와 outcome (Y) 모두로부터 영향을 받는 변수 (common effect). X → C ← Y 구조에서 C가 collider.
-
Confounder
Confounder는 treatment (X)와 outcome (Y) 모두에 영향을 주는 변수 (common cause)로, X와 Y 사이에 spurious (non-causal) association을 생성.
-
Constraint-Based Methods Overview
Constraint-based methods는 데이터의 conditional independence (CI) 관계를 테스트하여 인과 그래프를 복원하는 방법. Faithfulness 가정 하에서 CI 관계와 d-separation의 대응을 활용.
-
d-separation
d-separation (directional separation)은 DAG에서 두 변수 집합이 세 번째 집합에 조건부로 독립인지 판단하는 graphical criterion.
-
DAG (Directed Acyclic Graph)
DAG (Directed Acyclic Graph)는 변수 간의 causal relationship을 시각적으로 표현하는 그래프. Causal inference에서 confounding 구조를 파악하고 identification strategy를 결정하는 핵심 도구.
-
do-operator
do-연산자는 Pearl이 제안한 개입(intervention)을 형식화하는 방법입니다.
-
Double/Debiased Machine Learning (DML)
고차원 nuisance parameter $\eta0$ 존재 하에서 저차원 관심 parameter $\theta0$에 대한 유효한 통계적 추론을 수행하기 위한 방법론.
-
Doubly Robust Estimator
Doubly Robust (DR) Estimator는 outcome regression과 propensity score 모델을 결합하여, 둘 중 하나만 올바르게 specified되어도 consistent한 추정량.
-
DR-Learner
DR-Learner는 CATE 추정을 위한 2단계 doubly robust estimator로, Pseudo-outcome을 covariate에 대해 regression하는 방식.
-
Endogeneity
내생성(Endogeneity)은 설명 변수가 오차항과 상관될 때 발생하는 문제입니다.
-
Fundamental Problem of Causal Inference
동일한 개인에 대해 처치(W=1)와 대조(W=0)의 결과를 동시에 관측할 수 없는 문제
-
HTE (Heterogeneous Treatment Effects)
처치 효과가 개인의 특성에 따라 달라지는 현상
-
Instrumental Variables
도구변수(Instrumental Variables, IV)는 내생성 문제를 해결하기 위해 사용하는 외생적 변수입니다.
-
IPW (Inverse Propensity Weighting)
Propensity Score의 역수를 가중치로 사용하여 처치 효과 추정
-
ITE (Individual Treatment Effect)
개인 $i$에 대한 처치 효과
-
Mediator
Mediator는 treatment (X)가 outcome (Y)에 영향을 주는 causal pathway 상에 있는 중간 변수. X → M → Y 구조에서 M이 mediator.
-
Meta-learners
Meta-learners는 기존 supervised learning 방법 (base learner)을 활용하여 CATE를 추정하는 알고리즘의 총칭.
-
Positivity (Overlap)
모든 공변량 값에 대해 처치를 받을 확률이 0과 1 사이에 존재
-
Propensity Score Matching (PSM)
Propensity Score가 유사한 처치군과 대조군 개인을 매칭
-
R-Learner
R-Learner (Residualized Learner)는 Robinson Transformation을 기반으로 residualized outcome과 residualized treatment를 사용하여 CATE를 추정하는 Meta-learners.
-
Representation Learning Overview
처치와 독립적이면서 결과 예측에 유용한 표현(representation)을 학습하는 방법
-
S-Learner
S-Learner (Single Learner)는 treatment indicator를 feature로 포함하는 단일 모델로 response function을 추정한 후 CATE를 계산하는 Meta-learners.
-
SCM (Structural Causal Model)
SCM (Structural Causal Model)은 변수들 간의 인과 관계를 수학적으로 표현하는 framework. Pearl의 causal inference framework의 핵심.
-
Score-Based Methods Overview
Score-based methods는 그래프에 score function을 부여하고, 데이터에 가장 적합한 그래프를 탐색. Constraint-based와 달리 CI tests 없이 model fit 최적화.
-
Strong Ignorability
Ignorability와 Positivity를 결합한 가정
-
SUTVA (Stable Unit Treatment Value Assumption)
한 단위의 잠재 결과는 다른 단위의 처치 할당에 영향받지 않으며, 각 처치 수준에 대해 단일 버전만 존재한다.
-
T-Learner
T-Learner (Two Learner)는 treatment group과 control group에 대해 별도의 모델을 학습하여 CATE를 추정하는 Meta-learners.
-
Treatment Effects Overview
Potential Outcome Framework에서 추정 대상(estimand)이 되는 처치 효과(treatment effects)를 체계적으로 정리한다.
-
X-Learner
X-Learner는 imputed treatment effect를 활용한 3단계 알고리즘으로, 그룹 간 불균형과 CATE의 구조적 특성을 효과적으로 활용하는 Meta-learners.