Uplift Modeling
정의
Uplift(증분효과)는 처치(캠페인 노출·쿠폰·추천)가 한 개인의 결과(구매·전환)에 미치는 인과적 증분이다. 이진 처치 , 결과 , covariate 에 대해
즉 uplift는 이진 처치에서의 CATE 와 같다. “노출했을 때 얼마나 더 사는가”의 개인 수준 답.
직관적 이해
응답(response) 모델 은 살 사람을 찾지만, uplift 모델은 **노출 때문에 사게 되는 사람(persuadable)**을 찾는다. 4분면:
| 노출 시 구매 | 노출 시 미구매 | |
|---|---|---|
| 미노출 시 미구매 | Persuadable (타겟 ✓) | Lost cause |
| 미노출 시 구매 | Sure thing (낭비) | Sleeping dog (역효과 — 건드리지 말 것) |
타겟팅의 목적은 persuadable에만 처치를 집중해 ROI를 올리는 것.
추정 방법
- Meta-learners: S/T/X-learner, DR-Learner — 임의 ML로 추정
- Causal Forest: 트리 기반 직접 uplift 추정 (Wager & Athey 2018)
- R-learner / DML: 잔차 직교화로 robust 추정
장단점
- 장점: 응답 모델보다 자원 배분이 효율적(persuadable 집중), 음의 uplift(역효과) 탐지.
- 한계: 반사실은 관측 불가 → 라벨 없음(평가는 OPE·Qini/uplift curve로). 관측 데이터에서는 Selection Bias·positivity 위반에 취약.
프로젝트 적용
Dunnhumby: CausalForestDML로 세그먼트별 uplift 추정 — VIP Heavy −$38, Bulk Shoppers −$40 등 음의 CATE(sleeping dog) 발견, 전체 타겟팅 시 −$4,657 손실의 원인. (프로젝트 canonical)
관련 개념
- Targeting Overview ← 허브
- CATE · HTE — uplift = 이진 처치 CATE
- Optimal Targeting Policy — uplift를 정책으로 변환
- Off-Policy Evaluation — uplift 정책 가치 평가
참고
- MOC-Targeting