OCP Global Summit 2025_Broadcom_Networking for AI Scaling
- drshawnchang
- 10月15日
- 讀畢需時 2 分鐘
前言
在這場 OCP Global Summit 2025 的演講中,Broadcom 聚焦於 AI 擴展時代的網路基礎。隨著單一公司一次性宣布超過 26 GW 的資料中心計畫,AI 訓練與推論的基礎設施需求已經進入前所未有的規模。Broadcom 提出的核心觀點是:唯有 Ethernet 能同時支撐 Scale-up、Scale-out 與跨資料中心的 Scale-across。
內容
Broadcom 先點出現況:單一公司在短短 4 週內宣布 26 GW 的資料中心建設,換算下來相當於 1,500 萬個 XPU(涵蓋 GPU、TPU 或專屬加速器)。AI 的運算模式天生就是分散式架構,因此必須透過網路將數以十萬計的加速器串接起來。
Ethernet 的唯一性
三年前 Broadcom 就在 OCP 上提出「Ethernet 是 AI 網路的唯一選擇」。相比於專有協定,Ethernet 具有 開放性、彈性與經濟性,能橫跨所有的 Scale-up、Scale-out 與 Scale-across 場景。
Scale-up:跨 XPU 的高頻寬需求
隨著 HBM 頻寬從 40TB/s 演進到 100TB/s,XPU 之間的互連必須具備極高帶寬與低延遲。Broadcom 推出的 Ethernet for Scale-up Networking (ESUN) 讓異質 XPU 環境能自由競爭,避免被專有協定綁架。
Scale-out:降低成本與網路層級
Broadcom 展示比較:在 128K GPU 叢集設計中,採用 100Tb/s 交換器能減少網路層級與光模組數量,降低延遲與成本。對於動輒數十億美元規模的超大集群,這些設計差異能直接影響投資報酬。
光學與 CPO 的角色
隨著頻寬倍增,光學成為關鍵。Broadcom 已進入 第三代 CPO (Co-Packaged Optics),並強調 CPO 的可靠度甚至優於 pluggable optics。
Ultra Ethernet 與新一代 NIC
Broadcom 宣布 Thor Ultra —— 全球首款真正的 800G NIC,完全符合 UEC 標準,專為增強型 RDMA 設計。最大特色是「真正開放」,可與任何交換器、線材或 XPU 搭配。
總結
Broadcom 的核心訊息很清楚:The network is the computer, and Ethernet is the only way to scale AI infrastructure. Ethernet 不僅是成本效益最佳的選擇,也是唯一能支撐未來 AI 擴展的標準。
延伸觀點
技術影響:CPO 的進展,顯示 Ethernet 與矽光子整合將是突破帶寬與能耗瓶頸的必經之路。
供應鏈觀察:Broadcom 的 Thor Ultra NIC 與 Marvell 的 DSP、Credo 的 AEC/LRO,形成不同層級的競爭格局,矽光子模組廠如 Lumentum、InnoLight 也將是受益者。
市場趨勢:以 100K GPU 叢集為例,網路成本只佔總 CAPEX 的 3% 以下,卻能大幅影響效能與回收週期,這讓 Ethernet 成為企業必選的基礎建設投資。



留言