Customer Segmentation
정의
Customer Segmentation은 고객을 행동·가치·선호의 유사성으로 유한개 세그먼트로 분할하는 비지도(unsupervised) 과제다. 흔히 잠재요인 분해 후 군집화: 행동 피처 → NMF(비음수 parts-based 분해) → factor score → K-Means → 세그먼트.
직관적 이해
“수천 명을 개별 관리할 수 없으니, 비슷하게 행동하는 묶음으로 줄여 전략을 차별화한다.” 핵심은 세그먼트가 **실행 가능(actionable)**하고 **안정적(reproducible)**이어야 한다는 것.
타겟팅에서의 역할
세그먼트는 그 자체가 목적이 아니라 HTE moderator다 — 세그먼트별로 uplift가 다르므로, 세그먼트가 왜 이질적 효과가 나타나는지를 해석하는 축이 된다. (User Profiling이 개인 수준 표현이라면 세그먼트는 그 군집 요약.)
품질·안정성 진단
- 내부 품질: Silhouette, Davies-Bouldin, Calinski-Harabasz (현재 할당이 좋은가)
- 재현성: Bootstrap Stability + ARI (이 할당이 재현되는가)
- NMF vs PCA: 비음수·parts-based 해석력 때문에 행동 데이터에 선호.
프로젝트 적용
Dunnhumby: 5개 잠재요인이 행동 분산의 92.44% 설명, 7개 세그먼트(Bootstrap ARI 0.767 ± 0.113). High-value 세그먼트 45%가 매출 68.4% 기여. (프로젝트 canonical)
관련 개념
- Targeting Overview ← 허브
- NMF — 잠재요인 추출
- User Profiling — 개인 수준 선호 표현 (세그먼트의 원자 단위)
- HTE — 세그먼트는 효과 이질성의 moderator
참고
- MOC-Targeting