測試時間: 2025-12-21 20:35:35 (UTC+8)

測試範圍: 全部 Namespace


一、測試環境概述

1.1 叢集節點配置

節點名稱 角色 IP 位址 作業系統 Kubernetes 版本
master.example.com Control Plane 192.168.122.10 Rocky Linux 9.7 v1.24.0
node1.example.com Worker 192.168.122.11 Rocky Linux 9.7 v1.24.0
node2.example.com Worker 192.168.122.12 Rocky Linux 9.7 v1.24.0

1.2 執行中的工作負載

Namespace Pod 名稱 狀態 所在節點
default mydb-974568569-cn9q8 ✅ Running node2
default myweb-55d446c5cd-ms4mk ✅ Running node1
kube-system calico-node-bkd5d ⚠️ Running (0/1) master
kube-system coredns (x2) ✅ Running node1, node2

二、K8sGPT 診斷結果

2.1 各資源類型檢測摘要

資源類型 狀態 問題數量
Pod ⚠️ ProblemDetected 1
Node ✅ OK 0
Deployment ✅ OK 0
Service ✅ OK 0
Ingress ✅ OK 0

2.2 偵測到的問題

<aside> 🚨

問題 Pod: kube-system/calico-node-bkd5d

錯誤訊息:

Readiness probe failed: Number of node(s) with BGP peering established = 0

calico/node is not ready: BIRD is not ready: BGP not established with 192.168.122.11, 192.168.122.12

</aside>

2.3 K8sGPT AI 分析結果

<aside> 🤖

錯誤原因:

Readiness probe 失敗,原因是 BGP peering 尚未與指定節點建立連線,導致 Calico node 未就緒。

建議解決方案:

  1. 檢查節點 192.168.122.11192.168.122.12 上的 BGP 配置
  2. 確保節點之間的網路連通性
  3. 驗證所有節點上的 BIRD 服務是否正常運行
  4. 如有需要,重新啟動 Calico pods </aside>

三、深入診斷分析

3.1 問題根本原因

經過深入診斷,發現 Calico 自動偵測到錯誤的網路介面