鋼板表面缺陷偵測報告:基於 RT-DETR 之開發歷程
超參數設定
| 超參數 | 設定值 | 說明 |
|---|---|---|
| Batch Size | 16 | 批次大小。每一輪疊代模型同時看 16 張圖。 |
| Learning Rate | 0.0002 | 初始學習率。由於初期發生過 NaN(梯度爆炸),此處將其調低。 |
| Optimizer | AdamW | 優化器。Adam 的改進版,加入了權重衰減(Weight Decay),能有效防止模型過擬合(Overfitting)。 |
| Loss Function | GIoU + Class + L1 | 複合損失函數。GIoU 負責邊框定位準確度,Class 負責類別判斷,L1 則是針對 Transformer 解碼器的座標預測進行精細微調。 |
| Epoch | 100 | 最大訓練 Epoch。實測模型在 40 左右趨於穩定,100 epoch 可以確保模型收斂。 |
| Warmup Epochs | 5.0 | 預熱 Epoch。在正式訓練前,先用極小的學習率跑 5 輪,引導權重進入平穩區域,避免一開始就因為梯度過大而崩潰。 |
資料預處理
0 images, 2099 backgrounds。labels/ 資料夾,而原始資料存放於 label/。
20043.png:false positive,推測為雜訊形成連續直線,造成模型的誤判。

20155.png:false negative,推測為缺陷與背景雜訊太過接近,導致模型辨識失敗。
