OFC2026 - AI 叢集架構的典範轉移：Scale-Out 與 Scale-Up 光互連技術全解析 - Broadcom

1天前
讀畢需時 3 分鐘

在 2026 年的 OFC 大會上，Broadcom（博通）光學系統部門解決方案架構師 Anand Ramaswamy 的演講無疑為 AI 基礎設施的未來定下了基調。隨著百萬等級 GPU 叢集（Million GPU clusters）從藍圖走向現實，傳統的電互連（Copper）正遭遇物理極限的正面衝擊。本文將深入解析 Broadcom 如何透過 CPO（共封裝光學） 與新成立的 OCI（Optical Compute Interconnect）MSA，重新定義 AI 叢集的後端網路與擴展架構。

核心技術解析：Scale-Out 網路中的 CPO 實力展現

Broadcom 將 AI 網路細分為三個層次：前端網路（Front-End）、Scale-Out（後端網路） 以及 Scale-Up（加速器互連層） 。在 Scale-Out 領域，頻寬需求正從 400G、800G 迅速跨越至 1.6T，這使得功耗管理成為關鍵。

1. 功耗的降維打擊：6 pJ/bit 的極致追求

根據 Broadcom 提供的數據，在 100G/lane 的速率下，不同架構的功耗差異巨大：

DSP Pluggable (傳統插拔式模組)：約 15 pJ/bit 。
LPO (線性驅動插拔光學)：約 10 pJ/bit 。
CPO (共封裝光學)：僅需 6 pJ/bit 。

這意味著 CPO 相較於傳統光模組可降低約 65% 的功耗，相較於 LPO 也能節省 35% 。對於擁有數百萬個光互連點的 AI 資料中心而言，這直接轉化為數兆瓦級的電力節省。

2. TH5-Bailly：從實驗室走向 5,000 萬小時的穩定運作

Broadcom 的第二代 CPO 系統 TH5-Bailly（51.2T 交換器）已展現出驚人的可靠性。

硬體規格：內建 8 個 6.4T 光學引擎，每個引擎整合超過 1,000 個光學組件。
實戰數據：Meta 在 2025 年發布的試驗結果顯示，Bailly CPO 系統在首個 100 萬小時 運作中實現了 零鏈路閃斷（Zero Link Flaps） 。Anand 在演講中更更新此數據，累計運作已達 5,000 萬小時 且無不可修復故障。

這有力地回擊了市場對 CPO 可維護性與可靠性的質疑。Broadcom 透過將雷射源（Laser）移至外部（Remote Laser Source, ELSFP），解決了熱管理與維修的痛點。

產業新局：OCI MSA 劍指銅退光進的最後堡壘

Scale-Up（如 NVIDIA 的 NVLink 架構）目前仍由銅纜（DAC/ACC）統治，但隨著單機櫃功耗激增及佈線複雜度提升，銅纜已達極限。NVIDIA GB200 NVL72 系統的機櫃重量高達 700 公斤，且包含 5,000 對銅纜，其物理空間與冷卻挑戰顯而易見。

OCI MSA 的技術規格與野心

為了打破銅纜的物理屏障，Broadcom 聯手大廠創立了 OCI (Optical Compute Interconnect) MSA 。其核心邏輯在於尋求成本與性能的平衡點：

調變方式：採用 53G NRZ 而非更複雜的 PAM4，以降低延遲與功耗。
傳輸方案：4 波長的 WDM（波分復用） 與 Bi-Di（雙向傳輸），將纖維數量減半。
目標：將總功耗控制在 10 pJ/bit 以下（含 SerDes），使其在成本與電力上能與銅纜正面競爭。

市場影響：交換器節點的跨代演進

Broadcom 已經公布了下一代交換器 TH6-Davisson 的藍圖：

吞吐量：102.4 Tbps 。
介面速率：提升至 200G per lane 。
高 Radix 優勢：512 個 200G 通道，意味著在單層交換網路中可連接更多 GPU，大幅降低叢集延遲與總持有成本（TCO）。

Simple Tech Trend 觀點：光互連的「200G 臨界點」已到

2026 年是光通訊產業從「組件供應」轉向「系統整合」的關鍵年。

CPO 的全面成熟：Broadcom 透過 Meta 的大規模部署數據證明了 CPO 不再是學術課題，而是大規模生產的商用技術。12M 等效小時的測試與 50M 小時的實戰，是說服 Hyperscaler 放棄 Pluggable 的最強子彈。
Scale-Up 市場是下一個金礦：OCI MSA 的成立標誌著光學正式入侵 GPU 與 GPU 之間的短距互連（<10m）。雖然 53G NRZ 看似「慢」，但在極低功耗與高 Radix 的要求下，這才是目前量產最優解。
供應鏈影響：隨著 Broadcom 每年出貨超過 5,000 萬顆雷射晶片，矽光子（SiPh）的規模效應將進一步壓低成本。這將對傳統 DSP 廠商（如 Marvell）產生壓力，迫使產業向更輕量化、線性的光學方案（LPO/CPO）靠攏。