OFC2026 - CPO Integration Ready for AI Pipelines - OFC Workshop Panel- NVIDIA, Broadcom, Cisco, Oracle, Arista, AMD, Meta
- 15小时前
- 讀畢需時 6 分鐘
前言: 在 OFC 2026 這一光通訊產業的最高殿堂上,「共封裝光學 (CPO) 是否已準備好支撐 AI 管道?」成為最具決定性的戰略命題 。回顧歷史,IBM 早在 16 年前便於 Power 775 系統中達成 CPO 的首次商業部署,並出貨約 10,000 套系統 。然而,時至今日,隨著 AI 叢集規模向 130,000 個 GPU 邁進,傳統銅線與可插拔光學模組的物理極限已迫在眉睫 。本次Workshop匯聚了 Meta、Oracle、NVIDIA、Broadcom、Arista、Cisco 與 AMD 等產業鏈巨頭,從前端的矽光子元件良率,到後端的叢集總持有成本 (TCO) 與液冷散熱,進行了史無前例的深度數據碰撞。這不僅標誌著 CPO 從「技術火力展示」正式轉入「規模化量產」的深水區,更預告了未來 12.8T 至 51.2T 網路交換節點的版圖重塑。

核心技術與數據深度解析:各廠戰略與量產實績
在此次閉門級別的工作坊中,終端使用者 (Hyperscalers) 與晶片/系統供應商展現了截然不同的技術解方與量產進度。
1. Oracle:嚴守可靠性底線,倡議插槽化與擴展束技術
Oracle 傑出工程師 Mark Filer 指出,在其 130,000 個 GPU 的超級 AI 叢集中,節點已原生配置 1.6T NIC,並採用多平面 (Multi-plane) 擴展架構 。
核心痛點與 CPO 效益: 網路中斷對於高昂的 GPU 叢集是致命的。CPO 消除了人為插拔模組導致的故障點,且相較於完全可重構系統,可節省高達 50% 的功耗與 30% 的成本 。
架構偏好 (Socketed CPO): Oracle 強烈排斥與單一交換器 ASIC 供應商綁定的垂直整合封裝 。他們提倡如 PPAK 這樣的插槽式 CPO 方案,以便於 RMA 維修與實現多供應商生態 。
光學連接器創新: 針對前面板可能高達 4096 條光纖的單點故障風險 (Blast Radius),Oracle 點名支援「擴展束技術 (Expanded Beam Technology)」,如 US Conec 的 Prism PNT 或 3M 的 EBO,這能將物理插拔力降低 20 倍,並大幅提升對粉塵的免疫力 。
2. Meta:5,000 萬裝置小時的 CPO 可靠性實測數據大公開
Meta 光學基礎設施總監 Drew Alduino 帶來了業界最渴望的實戰數據,直指 TCO 才是最終決策依據 。
加速老化測試數據 (43°C 環境):
2x400G FR4 可插拔模組: 累計 6881.48G 裝置小時,平均故障間隔時間 (MTBF) 僅為 0.7 百萬小時 。
Phase 1 CPO 系統: 達到 4000 萬等效裝置小時 。若包含可插拔雷射光源 (PLS) 內部 SMT 元件的製造瑕疵,MTBF 約為 1.7 百萬小時 。若排除該可維修故障,CPO 的 MTBF 展現出比可插拔模組高達 10 倍的提升 。
常溫部署現況: Meta 目前已有 Phase 2 的 CPO 系統在 22°C 標準環境下運行,累計達 5000 萬裝置小時,且故障率極低,目前尚難以精準計算新的 MTBF 。

3. Arista:插拔式模組的反擊,發布 12.8T XPO 液冷架構
當多數大廠看好 CPO 時,Arista 的 Vijay Vusirikala 拋出了震撼彈,宣示「插拔式模組不會消亡」 。
XPO (Extra Dense Pluggable Optics) 規格: 容量高達 12.8 Tbps (200G/lane),相當於 8 個 OSFP 模組的吞吐量 。
原生液冷 (Native Liquid Cooling) 數據: 透過直接液冷設計,組件溫度可顯著降低 20 至 25°C,配合組件數量的減少,系統級可靠性將飆升 8 倍 。
密度極限: XPO 能在 1RU 空間內實現 204.8 Tbps (原需 4RU 的 OSFP),機架密度提升 4 倍,單一機架可達 6.4 Pbps 。
4. Broadcom:Tomahawk 6 CPO 量產與調變技術轉向
Broadcom 的 Matt Traverso 展現了其在 CPO 賽道的統治力。
Davidson 平台: 作為第三代 CPO 產品,這是首款結合 Tomahawk 6 (TH6) 核心裸晶的 100G 乙太網路 CPO 交換器 。
功耗數據: 與可插拔模組相比,實現了超過 70% 的功耗降低,並能將 Link Flap 錯誤率控制在遠低於 KP4 FEC 容忍度 (16 bit errors) 的水準 。
核心技術轉向: 宣布放棄 PAM4 調變,轉向 NRZ (或 M2) 編碼與 WDM 技術,以避免 PAM4 帶來的 4.8 dB 訊號雜訊比 (SNR) 懲罰 。
5. Cisco:良率與物理極限的冷水,「CPO 必然但非迫在眉睫」
Cisco 的 Anthony Torza 從工程物理學角度提出了務實的警告 。
訊號完整性 (SI) 極限: 在 200G 世代,0.9mm 的 BGA 間距已經大於四分之一波長,將引發嚴重的反射退化問題 。然而,Cisco 仍能利用傳統 PCB 佈線實現 64x OSFP (1600G) 的 200G/lane 交換器 。
良率噩夢 (The Yield Trap): 在一個搭載 16 個光學引擎的 CPO 系統中,即使單一引擎貼片良率達 95%,整機良率也僅剩約 44% ($0.95^{16}$) 。
散熱微觀效應: 100% 液冷系統會將氣流降至 2-3 CFM,這將從根本上消除傳統風冷帶來的灰塵累積與內部污染問題,無意間提升了現有模組的可靠性 。
6. NVIDIA:微環調變器 (MRM) 與台積電 COUPE 的商用突破
NVIDIA 的 Amir Saheki 揭示了 Scale-out (NVLink/InfiniBand) 架構下的矽光子進展 。
MRM 商用化: 首次在 Blackwell 等出貨產品中商用化微環調變器 (MRM)。儘管 MRM 對溫度極度敏感,NVIDIA 成功透過複雜的自適應電路與熱管理解決了穩定性問題 。
晶圓級封裝: 採用台積電 (TSMC) 的 COUPE 異質整合技術,整合 5nm 電子 IC (EIC) 與光子 IC (PIC) 。此製程允許在晶圓級別進行高吞吐量的光電測試 (EOE testing),大幅篩除不良品,實現 CMOS 等級的規模化降本 。
7. AMD:材料極限與介面共識
AMD 的 Juthika Basak 強調,CPO 帶來了 3 倍的能源效率提升 。
調變器瓶頸: 由於純矽缺乏強烈的電光效應,無論使用 MZI 或 MRM,都必須在尺寸與頻寬之間妥協,呼籲晶圓廠生態系引入新材料製程 。
耦合取捨: 邊緣耦合 (Edge Couplers) 對光學組裝的公差要求極高,而光柵耦合 (Grating Couplers) 則依賴晶圓廠的製程公差,這需要 OSAT 與 Foundry 的緊密協同 。
共識與分歧點深度剖析
絕對共識 1:TCO 與 RAS 決定一切。 所有的功耗降低 (降低 50-70%) 最終都是為了將電力還給 GPU,以提升 AI 代幣生成量 (Tokens/watt) 。可靠性 (Reliability)、可用性 (Availability) 與可維修性 (Serviceability) 是准入 AI 叢集的最低門檻 。
絕對共識 2:外部雷射 (ELS) 的必要性。 考量到雷射是主要熱源與潛在衰減元件,將高功率雷射以可熱插拔模組 (如 PLS) 的形式從 CPO 封裝中獨立出來,已成為各廠縮小「爆炸半徑」(Blast Radius) 的標準做法 。
戰略分歧 1:224G 世代的過渡路徑。 Oracle 與 Broadcom 認為 224G/lane 已是 CPO 的成熟切入點 ;Arista 則試圖用 12.8T XPO 液冷插拔模組截胡 ;Cisco 則堅稱 400G/lane 才是 CPO 技術發揮絕對優勢的「技術必然」(Technical Imperative) 。
戰略分歧 2:封裝型態 (Soldered vs. Socketed)。 晶片供應商傾向於直接焊死的 CPO 以優化訊號與封裝成本;而終端雲端巨頭 (如 Oracle) 則強烈要求 Socketed (插槽化) 或 NPO 架構,以確保多供應商貨源並降低單板報廢風險 。
產業鏈與市場影響
OSAT 與 Foundry 的價值重分配: NVIDIA 採用 TSMC COUPE 技術證明了 2.5D/3D 異質整合 (如混合鍵合 Hybrid Bonding) 已成為光電整合的終極解方 。無法提供次微米級 (Submicron) 光學對準與高吞吐量晶圓級 EOE 測試的封測廠,將被淘汰出局 。
標準化聯盟的勢力劃分: OCI MSA (NVIDIA, AMD, Broadcom, Meta 等) 正強勢主導 Scale-up (節點向上擴展) 的光學規範 ;而在 Scale-out (向外擴充) 端,XPO 等新型插拔規格將與早期 CPO 方案形成激烈定價戰 。
光學連接器大洗牌: 隨著光纖數量呈指數上升,傳統的 MPO 物理接觸連接器已不敷使用,擴展束 (Expanded Beam) 與非接觸式光學連接器將迎來爆發性成長 。
Simple Tech Trend 主筆觀點
作為緊盯矽光子與高速網路基礎設施演進的觀察者,本次 OFC 2026 讓我們看到 CPO 從「科學實驗」真正跨越到了「工程良率與供應鏈管理」的殘酷現實。
我們預判,在未來 12 到 24 個月內:
「雙軌並行」將是常態: 裝配原生液冷的超高密度插拔模組 (如 Arista 倡議的 XPO) 將在 224G/lane 世代吃下大量因 CPO 供應鏈良率爬坡不及而溢出的訂單 。
CPO 的黃金交叉落在 400G/lane: 當電氣走線的物理極限徹底封死 PCB 路由時,擁有 70% 功耗優勢的 CPO 將在 2027 年後迎來爆發 。
生態系的收斂: 唯有具備台積電等頂尖 Foundry 支援、能解決 16 顆光引擎同步貼片良率挑戰的 Fabless 巨頭,才能最終主導這場 130k GPU 互連的世紀之戰 。




留言