top of page

OFC2026 - 光子 Scale-Up 互連的極致功耗挑戰與技術路線解密 - OFC Panel

  • 10小时前
  • 讀畢需時 6 分鐘

前言:突破銅線物理極限的 Scale-Up 戰役

隨著 AI 模型參數規模呈指數級增長,XPU(GPU/TPU/NPU)之間的 Scale-Up(向上擴展)網路正承受前所未有的頻寬與功耗壓力。在 2026 年的 OFC 研討會「Chasing the Limit: On the Path to Photonic Scale-Up with Ultra-Low-Energy/Bit」中,產業鏈針對機架內(Intra-rack)高達 85% 的資料流量瓶頸展開激烈交鋒 。若採用傳統 10-20 pJ/bit 的光通訊方案,I/O 功耗將輕易佔據單一 AI 伺服器機架 30% 至 40% 的總功耗,嚴重排擠核心運算資源 。本次 Workshop 匯聚了 NVIDIA、Broadcom、Marvell 等巨頭,探討如何在 1.6T/3.2T 甚至更高頻寬節點上,將功耗極限壓縮至 1~3 pJ/bit,並達成極嚴苛的 FIT(Failures In Time)可靠度指標,確立了從 NPO(Near-Packaged Optics)過渡至 CPO(Co-Packaged Optics)的具體量產路徑與分歧點。



各廠觀點全紀錄:架構、光源與封裝的全面對決

針對 Scale-Up 網路的嚴苛要求,各家廠商提出了截然不同的技術解法與數據指標:

  • NVIDIA (Janet Chen)

    • AI 模型規模每兩年成長超過 4 倍,但 I/O 頻寬僅成長 1.4 倍,凸顯了嚴重的頻寬缺口 。

    • NVIDIA 正積極推進光學引擎(Optical Engine)與 XPU 的深度整合(CPO 架構),以解決資料「出不去」的 I/O 閒置問題 。

    • 為提升系統穩定度與降低功耗,NVIDIA 探討了微型共振腔(Microresonator)技術的應用潛力,以取代傳統能耗較高的方案 。


  • Broadcom (I-Hsing Tan)

    • 對於 Scale-Up 網路,Broadcom 強烈支持以 VCSEL 為基礎的 NPO 與 CPO 方案 。

    • 在使用 100G PAM4 傳輸下,NPO 方案可允許 6 至 13 dB 的插入損耗,並將功耗壓低至 1 pJ/bit 。

    • 成本與可靠度方面,Broadcom 宣稱其方案可達 $0.1/GB 以下的成本,且在超過 5300 萬設備運行小時中實現零故障(精算為 0.15 FIT) 。

    • 在單一 GPU 節點的北南向互連中,可支援高達 70 Tbps 的逃逸頻寬(Escape Bandwidth) 。


  • Marvell (Lenin Patra & Phil Winterbottom)

    • Marvell 指出傳統 32 Gbaud 方案雖然不需等化器,但通道開銷過高;而 100 Gbaud 方案則強制需要完整的 DSP 與 CDR 。

    • 目前電子系統的「最佳甜蜜點」落在 56 Gbaud,並搭配類比 DSP(Analog DSP)進行等化,藉此大幅降低功耗 。

    • 包含 SerDes 在內的完整光學鏈路功耗已可控制在 3 pJ/bit(其中雷射功耗約 0.7 pJ/bit,1.8V MRM 調變器功耗佔比極高) 。


  • Coherent (Chris Kocot)

    • 在「快且窄(Fast and Narrow)」的 VCSEL 架構與「慢且廣(Slow and Wide)」的 LED 架構對比中,VCSEL 展現了極致的能效 。

    • Coherent 指出其最佳化鏈路的總光學能耗僅需 0.18 pJ/bit(光學元件 0.3、電子元件 0.1 等組合計算) 。

    • 面對 200G 與 400G 單通道速率的未來藍圖,VCSEL 的直接調變已逼近物理極限,必須進行「量子躍遷(Quantum Leap)」式的架構創新(如外部調變 VCSEL)才能達成 。


  • University of Toronto (Joyce Poon)

    • 從系統級可靠度分析,機架內存在大量光學收發器,其佔據了 23% 的硬體故障比例,甚至略高於 GPU 本身 。

    • 在單通道失效案例中,雷射源(Laser)是最大的元凶,高達 90% 的故障肇因於此 。

    • 要實現真正無縫的運算光纖網路,光學互連必須達到與晶片間(Die-to-Die)電氣互連同等的頻寬密度,在 127 微米光纖間距下,需達到 >1 Tbps/fiber 的容量 。


  • Furukawa Electric (Kazuya Nagashima)

    • 展示了針對 200G 運作的 CPO 高密度封裝技術,並強調 8 通道介面的實用性與標準化 MPO 連接器的相容性 。

    • 熱管理對於可靠度至關重要,Furukawa 的分離式水冷系統設計可將 VCSEL 基板溫度控制在 50°C 甚至 40°C 以下,確保在百萬分之一以下的極低 FIT 率 。


  • Enlightra (John Jost) & Columbia University/xScape (Michal Lipson)

    • 針對多波長解決方案,微型光梳(Microcomb)技術成為突破頻寬天花板的關鍵,Enlightra 已展示使用單一雷射源與微型共振環產生 100 個以上的通道,達成 50 Tbps 甚至 2 Pbps 的傳輸速率 。

    • Columbia/xScape 已將光梳技術商品化,推出隨插即用的 8 波長光源,具備 40% 的高轉換效率,且單線功率達 0.5 mW,解決了多波長鎖定與功耗的問題 。

    • 產業界應將注意力轉移至接收端效率;目前的 IMDD 技術需要約 5000 個光子才能傳輸 1 bit,與量子極限相比存在高達 20 dB 的改善空間 。


  • AttoTude (Chris Fludger)

    • 提出非光學的 Terahertz(太赫茲)RF 晶片方案,直接挑戰短距光通訊在 10 至 40 公尺機架間互連的地位 。

    • Terahertz 方案具備 <3~4 pJ/bit 的極低功耗(支援 200G/400G),並延續了航太級 RF ASICs 破十億小時 MTBF 的極高可靠度,且具備高達 10 微米的對位容差,大幅降低封裝成本 。


數據對陣:功耗與可靠度的極限拉扯

在本次 OFC 會議中,各技術路線的底牌(Metrics)呈現了強烈的對比與競爭:

  • 功耗數據碰撞: Broadcom 主推的 VCSEL NPO 方案將指標壓至 1 pJ/bit 級別 ;Coherent 更是提出了 0.18 pJ/bit 的純光電核心能耗 。相對地,Marvell 基於矽光子與類比 DSP 的方案,在系統層級交付了 3 pJ/bit 的總鏈路功耗 。這顯示出 VCSEL 在純功耗數據上具備先天優勢,但矽光子方案在頻寬擴展性(WDM)上提供了更全面的解法。


  • 可靠度論戰: Broadcom 拋出震撼彈,宣稱其現有元件累積 5300 萬小時零故障(0.15 FIT) 。然而,多方陣營(包含學界的 Joyce Poon)強烈質疑,針對百萬節點級別的 AI 叢集,雷射光源貢獻了 90% 的單點故障率 ;Meta 的數據更指出 0.004% 的日故障率在百萬節點下將導致每天 40 次的系統崩潰 。因此,將雷射與高熱量 XPU 分離(ELSFP 架構)或採用強效液冷(Furukawa 方案 ),成為 CPO 量產的兩大護城河。


共識與分歧點分析

產業共識:

  1. 插拔式模組(Pluggables)在機架內 Scale-Up 網路走向終結: 為了達到 Terabit 級的岸面密度(Beachfront Density)與極低功耗,將光學元件推向 NPO 或 CPO 已是不可逆的趨勢 。


  2. DSP 的瘦身與移除: 重度依賴先進製程的數位 DSP 功耗過高。無論是採用 LPO(線性驅動插拔光學)、Analog DSP 或是移除發送端 DSP 方案,皆是為達成 5 pJ/bit 以下功耗目標的必要之舉 。


關鍵分歧點:

  1. 光源架構的抉擇(VCSEL vs. CW Laser + SiPh vs. Microcombs): Broadcom 堅守 100G/200G VCSEL 陣營,強調低成本與立竿見影的量產性 ;但包含 Marvell、NVIDIA 在內的陣營更看好高頻寬密度的矽光子 WDM 路徑 。Enlightra 則認為未來屬於單光源多波長的光梳技術,以消滅複雜的光纖陣列與雷射陣列 。


  2. 非光學方案的逆襲時機: 雖然光通訊被視為超過 2 公尺後的救星,但 AttoTude 展示的 Terahertz ASICs 證明了高頻 RF 技術在 10-40 公尺距內,仍可以 <4 pJ/bit 的功耗與傳統光學一戰,這讓 Scale-Up 技術路線圖增添了變數 。


產業鏈與市場影響

這場技術演進對全球光通訊與半導體供應鏈將產生深遠的財務與市佔影響:

  • 晶圓級封裝(台積電 / 封測大廠): CPO 落地高度依賴 TSV(矽穿孔)、Silicon Bridges 與高密度 3D 封裝技術 。具備 2.5D/3D 光電共封裝能力的代工廠將掌握核心定價權。

  • 雷射晶片供應商: 若市場轉向外置雷射(ELS)與微型光梳技術,傳統單一波長 DFB 雷射廠將面臨產品線重組壓力;而掌握高功率、高轉換效率 CW 雷射與 VCSEL 演進(如多核心、高頻寬調變)的廠商將迎來爆發成長。

  • 模組與連接器廠: 「減少光纖數量」成為終端客戶最大的痛點。能提供高通道數、盲插(Blind-mate)連接器以及 MPO 散熱整合方案的零組件供應商,將在 CPO 時代吃下豐厚利潤 。

Simple Tech Trend 觀點

OFC 2026 標誌著 AI 光互連從「頻寬競賽」正式轉入「能效與可靠度」的深水區。主編 STT 認為,在未來 12-24 個月內,NPO 結合 VCSEL 將吃下第一波 100G/200G per lane 的短距市場紅利,憑藉的是其成熟度與極低功耗;然而,隨著 NVIDIA 等巨頭的推波助瀾,結合外部雷射與類比 DSP 的矽光子 CPO 方案將在 2027 年後於頂級 AI 叢集完成霸權輪替。與此同時,投資人應高度關注光學連接器(Optical Connectors)與微型光梳(Microcombs)領域的新創動態,這些周邊技術的突破將是決定 CPO 能否順利跨越死亡之谷的真正關鍵。

留言


  • 線程
  • Facebook
  • Instagram

©2021 by DRFLYOUT. Proudly created with Wix.com

bottom of page