Confidence Sequence
정의
confidence sequence(CS) 는 time-uniform 커버리지를 갖는 신뢰구간 열: e-process / test supermartingale를 역산해 구성. 비모수 구성(Howard et al. 2021)은 line-crossing·mixture supermartingale 기반이며, 폭은 대략 (LIL rate)로 수축.
직관적 이해
연속적으로 들여다봐도 오류가 부풀지 않는 CI — 모든 표본 크기에서 동시에 유효. 고정- CI를 매 시점 다시 보는 “peeking” 문제를 푼다.
관련 개념
- e-process — CS ↔ e-process 쌍대
- Off-Policy Evaluation — anytime-valid OPE 구간
참고 논문
- Howard, Ramdas, McAuliffe & Sekhon, “Time-uniform, nonparametric, nonasymptotic confidence sequences”, Annals of Statistics 49(2):1055–1080, 2021
- Waudby-Smith, Wu, Ramdas, Karampatziakis & Mineiro, “Anytime-Valid Off-Policy Inference for Contextual Bandits”, ACM/IMS J. Data Science 1(3), 2024