앞서 언급했듯, 우리는 우리의 도메인에 꼭 맞는 데이터셋이 없다 (참고1). 이를 벤치마킹에서 유의미하게 사용하려면 최소 100장 이상 되어야 하며, 매우 정밀해야 한다. 하지만, 정밀한 semantic mask 데이터셋을 만드는 일은 1장당 90분 이상 걸리곤 할 만큼, 무척 무거운 작업일 수 있다 (참고2). 따라서 다양한 augmentation / model / resolution 에 따라 달라지는 것을 눈으로 보며 확인하는 것이 가장 빠르고 추적하기도 쉽다.

UNET_MOBILENETV2/

b128_9c_224_224_tpu_tfrecord_gcs

640 480

640 480

384 288

384 288

320 320

320 320

224 224

224 224

좌 : 640 480 우 : 384 288

좌 : 640 480 우 : 384 288

FPN_EFFICIENTNETB0/

b96_9c_288_384_tpu_tfrecord_gcs_nodice