OFC2026 - AI 集群互連架構之爭:從 XPO 到 CPO 與 THz 介質波導的典範轉移 - Microsoft, Arista, Marvell, AttoTude, nEye
- 1天前
- 讀畢需時 4 分鐘
前言
在 2026 年光網絡與通信研討會(OFC 2026)上,AI 集群互連(Interconnects)的演進已成為算力競賽的核心課題 。隨着 AI 模型規模以每兩年 3 倍的速度增長,網絡與內存的頻寬成長(每兩年 1.5 倍)已顯著滯後,形成了嚴重的「I/O 牆」挑戰 。本次會議揭示了從 2025 年 NVIDIA Blackwell 架構(機櫃功耗 120KW)向 2028 年 Rubin Ultra 架構(機櫃功耗 600KW)跨越時,互連技術如何在能效、熱管理與物理限制之間尋找新的平衡點 。


核心技術與大廠戰略深度解析
1. Microsoft:定義 Scale-up 時代的系統級指標
Microsoft 強調光學技術正從傳統的 Scale-out(數據中心級)滲透進 Scale-up(加速器機櫃級)領域 。
系統級整合:Azure 採取的策略是「從晶片到系統」(Silicon to Systems),包括自研 Azure Cobalt CPU 與 Maia AI 加速器 。
Scale-up 硬性規格要求:Fotini Karinou 提出 Scale-up 互連必須滿足:傳輸距離 > 20 米、單向頻寬 > 50 Tbps、往返延遲 < 1000 ns,以及能效低於 4 pJ/b 。
標準化驅動:Microsoft 正推動 OCI-MSA(專注於低功耗 WDM)以及 XPO 等標準,以應對高度複雜的光學堆棧(Optical Stack)需求 。















2. Arista Networks:XPO 與可插拔模組的最後防線
Andy Bechtolsheim 提出了一個驚人的預測:到 2028 年,AI 將需要 10 億個 1600G 等效的光學單元,這主要是由頻寬需求高出 Scale-out 十倍的 Scale-up 應用驅動 。
XPO 的極限封裝:XPO(Extra-dense Pluggable Optics)將 8 個 OSFP 模組的功能整合進單一液冷模組中,實現 12.8T 的超高密度 。
結構性成本優化:採用 XPO 可減少 75% 的機櫃、電源母線及管道需求,甚至能讓 AI 數據中心的佔地面積縮減 50% 。
可靠性躍升:透過液冷技術將激光器工作溫度降低 20-25°C,單個 12.8T 模組的故障率(FIT)預計低於 20 。
















3. Marvell:Photonic Fabric 與矽光子 CPO 藍圖
Marvell 展示了針對 Scale-up 網絡優化的全面產品線,致力於打破 copper reach(< 2m)的物理屏障 。
COUPE CPO 技術:採用 TSMC N3P 工藝,透過混合鍵合(Hybrid Bonding)技術整合 EIC 與 PIC,實現 1 Tbps/fiber 的 DWDM 傳輸 。
Photonic Fabric 晶片組:Gen 1 提供 16 Tbps 頻寬(超越 HBM3E),Gen 2 則瞄準 64 Tbps(對接 HBM4),且能效低於 3.1 pJ/b 。
多樣化佈局:除了 CPO,Marvell 亦提供 6.4T Light Engine 支持 NPO 與液冷系統設計 。









4. AttoTude:太赫茲(THz)介質波導的降維打擊
Dave Welch 提出了一個極具顛覆性的觀點:與其依賴激光器,不如利用電晶體產生太赫茲光子 。
THz ASIC 方案:利用標準電子工廠生產 800 GHz 的 ASIC,並透過介質波導(Dielectric Waveguide)傳輸,而非傳統的光纖或銅纜 。
極致性能:在 448G PAM4 下能效為 2.8 pJ/b,傳輸距離可達 20-40 米,且具備與銅纜相當的 10 億小時 MTBF 可靠性 。
成本結構:由於不需精密光學對準(對準公差可放寬至 10 um),其成本結構將與銅纜鏈路一致 。











5. nEye Systems:2D OCS 晶片推動算力池化
Ming Wu 解析了光路交換(OCS)如何從 Google 的 3D MEMS 演進至 2D 矽光子晶片 。
2D OCS 優勢:相比傳統 3D OCS,2D 架構功耗低於 5W(降低 20 倍)、延遲低於 5 ns(降低 10 倍)、切換速度快至 5 us 以內 。
算力池化關鍵:快速切換技術使 OCS 能在 Scale-up 域中靈活擴展高頻寬域,並提升推理應用的彈性 。











專家共識與分歧分析
維度 | 產業共識 | 主要分歧點 |
傳輸介質 | 銅纜在 224G/448G 下的距離限制(< 2m)使其無法滿足跨機櫃 Scale-up 需求 。 | AttoTude 主張用 THz 波導取代光纖 ;Arista 仍視 Active Copper 為 5m 內的強效方案 。 |
封裝形態 | CPO 是長期達到最高帶寬密度與最低功耗的終極路徑 。 | Arista 認為 CPO 供應鏈成熟太慢,主張 XPO 才是 2028 年 10 億單元市場的解答 。 |
冷卻方案 | 液冷(Liquid Cooling)對高密度機櫃及超大型光學模組至關重要 。 | 如何在 CPO 系統中實現模組化維修(Serviceability)仍有待商榷 。 |
Simple Tech Trend 觀點:
本次 OFC 2026 釋放了一個明確信號:互連技術正在「電子化」與「光學化」的邊界進行重組。
XPO 將是未來三年的中流砥柱:儘管 CPO 在技術指標上完美,但 Andy Bechtolsheim 指出的「時間到產能」(Time to Volume)是致命傷。XPO 透過液冷技術解決了可插拔模組的散熱痛點,將極大程度延後 CPO 成為主流的時間點 。
Scale-up 網絡的專有化趨勢:Microsoft 與 Marvell 的討論顯示,Scale-up 互連將不再追求通用的以太網標準,而是轉向如 Photonic Fabric 等協議自適應(Protocol Adaptive)的架構,以追求極限延遲 。
THz 介質波導是最大的變數:AttoTude 提出的方案如果能成功導入 HVM,將徹底改變光通訊產業對激光器的依賴,這對傳統雷射晶片商而言是長期的系統性風險 。




留言