-
design space의 quality를 design space로부터 model들을 sampling해서 정량화
-
model error distribution으로 특징화
-
How to obtain a distribution of models?
- low-compute, low-epoch training regime
- e.g. use the 400M flop regime and train each sampled model for 10 epochs
-
The error empirical distribution function (EDF)

$$
F(e)=\frac{1}{n}\sum^n_{i=1}\mathbf{1}[e_i<e] \tag{1}
$$
- $F(e)$ : $e$보다 낮은 error를 보인 모델들의 비율
- empirical bootstrap
- 주어진 $n$개의 $(x_i,e_i)$ 쌍에서 25%만 추출
- $x_i$ : model statistic (e.g. depth)
- $e_i$ : error
- 최소 error를 갖는 쌍을 선택
- 1~2를 $10^4$번 반복
- 최소 $x$ 값에 대해 95% CI계산 → best value