Tae Hyun Kim (Lowell)
데이터 사이언티스트 · Data Lab, 한화손해보험 · 대리 · 서울
Personalized decision-making under uncertainty, made causal.
고위험·개인화 의사결정을 causal inference와 data-driven 방법으로 다루는 데이터 사이언티스트입니다. 이를 위해 statistical·probabilistic modeling, optimization, ML/AI, LLM 기반 agentic systems를 활용하며 — 산업과 의료 연구 양쪽에서 단순 예측이 아니라 counterfactual reasoning과 policy learning으로 문제에 접근합니다.
연구 관심사
연구기둥 →Causal Inference
CATE · counterfactual · causal discovery · SCM · semiparametric · partial ID
무엇이 무엇을 일으키는가 — heterogeneous treatment effects와 counterfactual을, structural causal models·semiparametric estimation·unobserved confounding 하 sensitivity/partial identification으로 식별한다.
노트 51개 → 02Decision-Making under Uncertainty
bandits · RL · OPE · DTR/OTR · policy learning
추정된 효과를 결정으로 — optimal policy learning, bandits·reinforcement learning, off-policy evaluation, dynamic/optimal treatment regimes.
노트 20개 → 03Personalization
HTE · targeting · recommendation · pricing
through-line — 임상의 individualized treatment decisions와 산업의 targeting·recommendation·pricing은 동일한 methodological core의 양면이다.
노트 20개 →선정 프로젝트
전체 3개 프로젝트 →- 01
고객 세분화와 인과 타겟팅
공개 Dunnhumby 리테일 데이터로 NMF·K-Means 세분화부터 메타러너·Causal-Forest HTE 추정, OPE로 검증한 최적 타겟팅 정책까지 잇는 엔드투엔드 분석.
- 02
인과 기반 멀티터치 어트리뷰션
단일 Inhomogeneous Poisson Process 위에 Incremental·Shapley 채널 기여도와 path-level 분해를 통합해, 채널 예산·여정 설계·모집단 인과효과를 하나의 효율성 항등식으로 답한 시뮬레이션 연구(18-method 벤치마크, ground-truth MAE 0.016
- 03
지금 이 사이트의 챗봇
이 사이트의 grounded RAG 어시스턴트 — 정적 Cloudflare 엣지 위에서 발행된 노트만 근거로 답하는 안전한 LLM. 데모는 이 페이지 우측 하단의 버튼입니다.
Play & Learn
데모 전체 →1분짜리 인터랙티브 데모로 반직관적 결과를 직접 만져보세요.
최근 노트
전체 82개 노트 →- 01
Dunnhumby — Track 1: Latent-Factor Customer Segmentation
NMF latent factors (92.44% explained variance) + K-Means yield 7 stable behavioral segments (Bootstrap ARI 0.77) with per-segment marketing actions. Illustrative case study on the public Dunnhumby retail dataset.
- 02
Dunnhumby — Track 2: Causal Targeting via Heterogeneous Treatment Effects
심각한 positivity violation(PS AUC 0.989) 아래에서 Meta-learner·Causal Forest로 CATE를 추정한다. 최적 정책은 고객의 약 31%를 타겟팅하고, 반직관적인 음의 CATE 세그먼트를 드러낸다. 공개 데이터 기반의 가설 생성용 분석이다.
- 03
Applied Causal Inference for Pricing — CATE & SCM Across Public Datasets
An applied case study using only public datasets (LendingClub, iPinYou) that combines CATE estimation for price-sensitivity heterogeneity with SCM-based moderator analysis to design individual-level, risk-based pricing and RTB bidding policies — all findings illustrative and projected, not proprietary.
- 04
Causal Inference Under Partial Identification — Sensitivity and Evidence Hierarchies
When real-world data fail strong ignorability, point identification gives way to bounds, proxies, and sensitivity analysis — an honest hierarchy of evidence that connects credible causal claims to semiparametric efficiency.
- 05
Customer Segmentation
Customer Segmentation은 고객을 행동·가치·선호의 유사성에 따라 유한 개의 세그먼트(segment)로 나누는 비지도(unsupervised) 과제다. 보통 잠재요인을 먼저 분해한 뒤 군집화하는데, 그 흐름은 행동 특성(feature) → NMF(비음수 parts-based 분해) → factor…
- 06
Customer Segmentation & Causal Targeting — An Applied Case Study
An end-to-end applied case study on the public Dunnhumby dataset — NMF latent factors and K-Means segmentation feeding meta-learner / Causal Forest HTE and an OPE-validated optimal targeting policy, with a candid look at positivity violation and counter-intuitive "sleeping dog" segments.
연락처
소개 · 이력 →taehyun9573@gmail.com ·대한민국 서울