top of page

OFC2026 - AI 叢集架構的典範轉移:Scale-Out 與 Scale-Up 光互連技術全解析 - Broadcom

  • 1天前
  • 讀畢需時 3 分鐘

在 2026 年的 OFC 大會上,Broadcom(博通)光學系統部門解決方案架構師 Anand Ramaswamy 的演講無疑為 AI 基礎設施的未來定下了基調。隨著百萬等級 GPU 叢集(Million GPU clusters)從藍圖走向現實,傳統的電互連(Copper)正遭遇物理極限的正面衝擊 。本文將深入解析 Broadcom 如何透過 CPO(共封裝光學) 與新成立的 OCI(Optical Compute Interconnect)MSA,重新定義 AI 叢集的後端網路與擴展架構。


核心技術解析:Scale-Out 網路中的 CPO 實力展現

Broadcom 將 AI 網路細分為三個層次:前端網路(Front-End)、Scale-Out(後端網路) 以及 Scale-Up(加速器互連層) 。在 Scale-Out 領域,頻寬需求正從 400G、800G 迅速跨越至 1.6T,這使得功耗管理成為關鍵 。


1. 功耗的降維打擊:6 pJ/bit 的極致追求

根據 Broadcom 提供的數據,在 100G/lane 的速率下,不同架構的功耗差異巨大 :


  • DSP Pluggable (傳統插拔式模組):約 15 pJ/bit 。


  • LPO (線性驅動插拔光學):約 10 pJ/bit 。


  • CPO (共封裝光學):僅需 6 pJ/bit 。


這意味著 CPO 相較於傳統光模組可降低約 65% 的功耗,相較於 LPO 也能節省 35% 。對於擁有數百萬個光互連點的 AI 資料中心而言,這直接轉化為數兆瓦級的電力節省。


2. TH5-Bailly:從實驗室走向 5,000 萬小時的穩定運作

Broadcom 的第二代 CPO 系統 TH5-Bailly(51.2T 交換器)已展現出驚人的可靠性 。


  • 硬體規格:內建 8 個 6.4T 光學引擎,每個引擎整合超過 1,000 個光學組件 。


  • 實戰數據:Meta 在 2025 年發布的試驗結果顯示,Bailly CPO 系統在首個 100 萬小時 運作中實現了 零鏈路閃斷(Zero Link Flaps) 。Anand 在演講中更更新此數據,累計運作已達 5,000 萬小時 且無不可修復故障 。


這有力地回擊了市場對 CPO 可維護性與可靠性的質疑。Broadcom 透過將雷射源(Laser)移至外部(Remote Laser Source, ELSFP),解決了熱管理與維修的痛點 。


產業新局:OCI MSA 劍指銅退光進的最後堡壘

Scale-Up(如 NVIDIA 的 NVLink 架構)目前仍由銅纜(DAC/ACC)統治,但隨著單機櫃功耗激增及佈線複雜度提升,銅纜已達極限 。NVIDIA GB200 NVL72 系統的機櫃重量高達 700 公斤,且包含 5,000 對銅纜,其物理空間與冷卻挑戰顯而易見 。


OCI MSA 的技術規格與野心

為了打破銅纜的物理屏障,Broadcom 聯手大廠創立了 OCI (Optical Compute Interconnect) MSA 。其核心邏輯在於尋求成本與性能的平衡點 :


  • 調變方式:採用 53G NRZ 而非更複雜的 PAM4,以降低延遲與功耗 。


  • 傳輸方案:4 波長的 WDM(波分復用) 與 Bi-Di(雙向傳輸),將纖維數量減半 。


  • 目標:將總功耗控制在 10 pJ/bit 以下(含 SerDes),使其在成本與電力上能與銅纜正面競爭 。



市場影響:交換器節點的跨代演進

Broadcom 已經公布了下一代交換器 TH6-Davisson 的藍圖:

  • 吞吐量102.4 Tbps 。


  • 介面速率:提升至 200G per lane 。


  • 高 Radix 優勢:512 個 200G 通道,意味著在單層交換網路中可連接更多 GPU,大幅降低叢集延遲與總持有成本(TCO)。


Simple Tech Trend 觀點:光互連的「200G 臨界點」已到

2026 年是光通訊產業從「組件供應」轉向「系統整合」的關鍵年。

  1. CPO 的全面成熟:Broadcom 透過 Meta 的大規模部署數據證明了 CPO 不再是學術課題,而是大規模生產的商用技術。12M 等效小時的測試與 50M 小時的實戰,是說服 Hyperscaler 放棄 Pluggable 的最強子彈 。


  2. Scale-Up 市場是下一個金礦:OCI MSA 的成立標誌著光學正式入侵 GPU 與 GPU 之間的短距互連(<10m)。雖然 53G NRZ 看似「慢」,但在極低功耗與高 Radix 的要求下,這才是目前量產最優解 。


  3. 供應鏈影響:隨著 Broadcom 每年出貨超過 5,000 萬顆雷射晶片,矽光子(SiPh)的規模效應將進一步壓低成本 。這將對傳統 DSP 廠商(如 Marvell)產生壓力,迫使產業向更輕量化、線性的光學方案(LPO/CPO)靠攏。


我們將看到更多 AI 晶片廠(尤其是 ASIC 廠)將 OCI 規範整合至 SoC 封裝內,銅纜在 AI 叢集中的地位將正式萎縮至僅剩機櫃內的超短距應用。









留言


  • 線程
  • Facebook
  • Instagram

©2021 by DRFLYOUT. Proudly created with Wix.com

bottom of page