Tae Hyun Kim (Lowell)

Confidence Sequence

1분 읽기 #experiments#anytime-valid

정의

confidence sequence(CS) (Ct)t1(C_t)_{t\ge1}time-uniform 커버리지를 갖는 신뢰구간 열: P(t1: θCt)1α.P\big(\forall t\ge 1:\ \theta\in C_t\big)\ge 1-\alpha. e-process / test supermartingale를 역산해 구성. 비모수 구성(Howard et al. 2021)은 line-crossing·mixture supermartingale 기반이며, 폭은 대략 loglogt/t\sqrt{\log\log t/t} (LIL rate)로 수축.

직관적 이해

연속적으로 들여다봐도 오류가 부풀지 않는 CI — 모든 표본 크기에서 동시에 유효. 고정-nn CI를 매 시점 다시 보는 “peeking” 문제를 푼다.

관련 개념

참고 논문

  • Howard, Ramdas, McAuliffe & Sekhon, “Time-uniform, nonparametric, nonasymptotic confidence sequences”, Annals of Statistics 49(2):1055–1080, 2021
  • Waudby-Smith, Wu, Ramdas, Karampatziakis & Mineiro, “Anytime-Valid Off-Policy Inference for Contextual Bandits”, ACM/IMS J. Data Science 1(3), 2024

연결 그래프