筆記

LLM 的網路通訊基礎

GPU 擴展的極限

集合通訊 (Collective Communication) 基礎

image.png

一個完整的 All Reduce 操作,其實可以等價拆解為先執行 Reduce Scatter,接著再執行 All Gather 兩個步驟。 在網路頻寬受限的環境下,這種「先歸約分散、再全收集」的做法是最佳的通訊策略,因為這兩個步驟加起來的通訊成本,剛好就等於直接執行一次 All Reduce。這也是後續理解 ZeRO 策略如何節省記憶體的關鍵基礎。

image.png

總結