앙상블 추론은 무조건 → 좋은 모델 선정 → 확률 개선
추론 시 센터 크롭 top0.9. front0.9
top이미지를 구분하는게 중요함.
# 첫 0.017 분포도
[앙상블 결과] 확률 분포
────────────────────────────────────────────────────────────
mean = 0.5010827405
std = 0.4936476843
min = 0.0000757497
max = 0.9999382000
median = 0.2250381600
구간별 분포:
[0.0~0.1): 483 ████████████████████████
[0.1~0.2): 15 █
[0.2~0.3): 3
[0.3~0.4): 2
[0.4~0.5): 0
[0.5~0.6): 0
[0.6~0.7): 0
[0.7~0.8): 0
[0.8~0.9): 6
[0.9~1.0): 491 ████████████████████████
unstable 예측 (>0.5): 497개 / 1000개
stable 예측 (≤0.5): 503개 / 1000개
기존 0.017 평균 앙상블(단순 평균) 추론 + 0.9 * 0.9 추론 크롭을 → top 상단 크롭만 한 것 1개 → 다수결 추론 앙상블 + top 0.7 크롭 1개 제출하기. → 과적합 확정 추론 실패 → 0.03587933
Models: ['eva_giant'] × 5 checkpoints
Folds: [0, 1, 2, 3, 4] | TTA: True | Temp: 1.0
Front crop: 0.9 | Top crop: 0.7
unstable_prob: mean=0.5130 std=0.4858
최신 제출: submission_eva_giant_tta_v2.csv
샘플 수 : 1000
unstable_prob : mean=0.5130 std=0.4858
> 0.5 : 501개 | < 0.5 : 499개
id unstable_prob stable_prob
0 TEST_0001 0.000211 0.999789
1 TEST_0002 0.999811 0.000189
2 TEST_0003 0.999697 0.000303
3 TEST_0004 0.999836 0.000164
4 TEST_0005 0.018991 0.981009
단순 평균이 좋은 지 majority_best가 좋은 지 테스트