CrashLoopBackOff 修復報告

<aside> 📋

Run ID: 20251227-153501-57898

執行時間: 2025-12-27 15:38:12 → 15:40:17 (約 2 分鐘)

命名空間: demo-crashloop

狀態: ✅ 修復成功

</aside>


📊 監控數據

Prometheus Query: increase(kube_pod_container_status_restarts_total{namespace="demo-crashloop"}[5m])

image.png

關鍵指標變化:


🔍 問題診斷

發現的問題

資源類型 命名空間 資源名稱 問題狀態
Deployment demo-crashloop crashloop-demo 副本不可用
Pod demo-crashloop crashloop-demo-89f947c9-m8c56 CrashLoopBackOff (已重啟 6 次)

根因分析

問題現象:

容器日誌顯示重複的 startboom 輸出,隨後容器退出並重啟。

根本原因:

容器啟動命令中包含 exit 1,導致容器故意以錯誤碼退出,觸發 Kubernetes 的重啟機制,進入 CrashLoopBackOff 循環。

# 問題命令
echo 'start'; sleep 5; echo 'boom'; exit 1