#experiments

노트 7개

A/B Testing A/B 테스트는 무작위 대조 실험(RCT)의 온라인 응용으로, 두 가지 이상의 변형(variants)을 무작위로 사용자에게 노출시켜 인과 효과를 추정하는 방법입니다.
Anytime-Valid Inference Overview 고정 표본 가설검정의 "peeking" 문제를 푸는 game-theoretic statistics. 식별-타당성 drift를 실시간 모니터링하는 안전 추론의 수학적 기초.
Confidence Sequence confidence sequence(CS) $(Ct){t\ge1}$는 time-uniform 커버리지를 갖는 신뢰구간 열:
CUPED CUPED (Controlled-experiment Using Pre-Experiment Data)는 사전 실험 데이터를 활용하여 A/B 테스트의 분산을 줄이는 기법입니다.
Design Effect 설계 효과(Design Effect, DEFF)는 복잡한 표집 설계가 단순 무작위 표집에 비해 분산에 미치는 영향을 측정합니다.
e-process (e-value) e-value $E$는 귀무가설 $H0$ 하 $EP[E]\le 1$ ($\forall P\in H0$)인 비음 확률변수. e-process $(Et)$는 임의의 정지시각 $\tau$에 대해 $E\tau$가 e-value인 비음 과정($E[E\tau]\le1$) — 보통 귀무 하 비음 supermartingale.…
Statistical Power 통계적 검정력(Statistical Power)은 효과가 실제로 존재할 때 그것을 탐지할 확률입니다.