深度解析 ISSCC 2026：AI 算力狂飆下的光互連技術突圍，矽光子的極限與下一戰場

3月2日
讀畢需時 6 分鐘

近年來，生成式 AI 與大型語言模型的快速發展，正以每 6 個月翻一倍的速度推升算力需求。這遠遠超越了傳統摩爾定律下，處理器效能與記憶體頻寬每 2 年翻倍的演進節奏。

為了匹配如此巨大的算力缺口，AI 叢集的規模已經從數千個擴展至 1 萬到 10 萬個 XPU 的超大規模。在這樣的叢集中，算力早已不是唯一的痛點，「海量資料的跨節點搬運」所帶來的頻寬牆與功耗牆，才是決定 AI 基礎設施天花板的真正關鍵。

在剛落幕的 IEEE 國際固態電路會議（ISSCC 2026）上，一場圍繞著光互連（Optical Interconnect）的底層革命正在上演。從 Broadcom、Nvidia、Marvell 到 Celestial AI，各家科技巨頭與頂尖學術機構不約而同地將目光聚焦於 3D 異質整合、共封裝光學（CPO）以及輕量化相干通訊（Coherent-Lite）。

傳統的矽光子（Silicon Photonics, SiPh）是否已經面臨極限？未來的 Scale-up 網路又將由誰主導？這篇文章將帶你從底層硬體架構，一次看懂 ISSCC 2026 揭示的光互連技術終局。

1. 頻寬焦慮與材料換代：單通道 400G 將成矽光分水嶺？

要探討光通訊的未來，我們必須先看懂產業的演進路線。網路巨頭 Arista 在 ISSCC 2026 的論壇中明確指出，數據中心可插拔光模組正快速朝向 800G、1600G 邁進，並預計在 2028 年迎來 3200G（8x400G）的代際躍遷。

傳統矽光子的「106GHz 物理極限」 當單通道速率逼近 400G PAM-4 時，系統需要達到約 106GHz 的奈奎斯特頻率（Nyquist frequency）。在這個極限速率下，傳統矽光技術的頻寬瓶頸便開始浮現，無論是載子耗盡型調變器的響應速度，還是光電轉換的損耗，都顯得捉襟見肘。

Arista 點出了一個明確的趨勢：在 400G/Lane 的時代，具備 100+ GHz 頻寬潛力的新型光學平台——如磷化銦（InP）與薄膜鈮酸鋰（TFLN）——將會強勢崛起，甚至逐步蠶食傳統矽光的市場份額。

「慢而寬」的低功耗哲學 此外，Arista 也表態不看好高階調變技術（如 PAM-6），因為過於複雜的數位訊號處理（DSP）會帶來難以承受的功耗開銷。未來的極致低功耗解法，將是走向消除高速 SerDes 的**「Slow & Wide（慢而寬）」並行介面架構**。透過 50G NRZ 等較低速率但高密度的通道陣列，配合線性驅動（LPO）或 CPO 封裝，徹底移除耗電的 DSP 與 SerDes，這為接下來的晶片級封裝大戰定下了基調。

2. 決戰 XPU 旁：CPO 與 3D 封裝的百家爭鳴

為了解決傳統可插拔光模組在功耗與訊號完整性上的劣勢，將光引擎（PIC）與運算晶片（EIC 或 ASIC）透過 2.5D/3D 封裝拉近至幾公釐之內（CPO / 封裝內光 I/O）已是業界共識。但在具體的技術實作上，各家卻展現了截然不同的解題思路：

Broadcom：極致吞吐量與「直接驅動」的架構減法

針對 51.2T 網路交換機的龐大 I/O 需求，Broadcom 展示了一款基於 7nm ASIC 與矽光 MZM 的 3D 封裝 6.4Tb/s CPO 方案。

其最大的亮點在於接收端（RX）的「直接驅動 TIA（跨阻放大器）」架構。傳統架構中，光訊號轉電後還需經過多級放大與重定時；而 Broadcom 的設計讓 TIA 輸出直接驅動主機 ASIC，配合 DSP 自適應調節，省去了多餘的訊號轉換級數。這項「減法」讓單路 106.25Gb/s PAM-4 的能量效率壓低至驚人的 4.2 pJ/b，在極限吞吐量下守住了功耗底線。

Nvidia：DWDM 與「半速率時脈轉發」的功耗魔法

Nvidia 著眼於 GPU 之間的高密度 Scale-up 互連，推出了 256Gb/s DWDM（密集波分復用）3D 堆疊 CPO。DWDM 能在一根光纖內塞入多個波長，是提升頻寬密度的利器，但也面臨嚴苛的時脈同步挑戰。

在傳統 DWDM 鏈路中，若採用時脈資料恢復（CDR）模組會極度耗電；若採用直接轉發時脈（Forward Clock, FC），TIA 的熱雜訊又會被放大。Nvidia 的創新在於採用了「半速率帶通濾波時脈轉發」機制。他們在 1310nm 波段上配置了 9 個微環諧振器（間隔 200GHz），其中 8 個傳輸數據，1 個專注傳輸時脈，並透過帶通濾波器精準消除隨機雜訊。這套架構去除了吃電的 CDR，實現了高達 1.33 Tbps/mm² 的極高面積效率。

更詳細的說明可參考以下文章。

NVIDIA 於 ISSCC 2026 投下的矽光子震撼彈：3D 堆疊與低延遲 DWDM 鏈路

Celestial AI：直擊「熱穩定性」痛點的 EAM 調變器

封裝內光 I/O 最大的隱形殺手是「熱」。與 XPU 封裝在一起，意味著光學元件必須承受動輒 80°C 的高溫。傳統的微環調變器（MRM）對溫度極度敏感，溫度一變頻率就漂移，需要耗費大量額外功耗進行熱補償（Thermal tuning）。

Celestial AI 的 5nm CMOS 與矽光 3D 整合收發器，大膽捨棄了 MRM，改用鍺矽（GeSi）電吸收調變器（EAM）。EAM 的物理特性使其具備優異的熱強健性，實測發現在 30°C 到 80°C 的劇烈溫度變化下，只需微調直流偏壓即可穩定運作，完全不需要複雜的後台校準。這款單組 TX/RX 面積僅 0.09mm² 的晶片，為高溫的 AI 叢集環境提供了一個極具商業潛力的解答。

廠商	核心架構與製程	解決的關鍵痛點	創新技術亮點 (架構/元件)	關鍵效能指標 (Metrics)
Broadcom	7nm ASIC + 矽光 MZM (3D 封裝 CPO)	51.2T 交換機龐大 I/O 下的「功耗與訊號轉換開銷」。	直接驅動 TIA 架構接收端 TIA 輸出直接驅動主機 ASIC，省去多餘訊號放大與重定時級數（架構減法）。	• 總吞吐量：6.4 Tb/s • 單路速率：106.25 Gb/s (PAM-4) • 系統能效：4.2 pJ/b
Nvidia	7nm EIC + 65nm PIC (DWDM 3D 堆疊 CPO)	DWDM 鏈路中，傳統 CDR 模組太耗電，而直接轉發時脈又會放大「熱雜訊與抖動」。	半速率帶通濾波時脈轉发 9 個波長中獨立 1 個傳輸時脈，並用帶通濾波器精準消除隨機雜訊，徹底移除耗電的 CDR。	• 總吞吐量：256 Gb/s • 波長配置：1310nm (間隔 200GHz) • 面積效率：1.33 Tbps/mm²
Celestial AI	5nm CMOS + 矽光 (3D 整合收發器)	XPU 旁動輒 80°C 的高溫，導致傳統微環調變器 (MRM) 頻率漂移的「熱穩定性」問題。	鍺矽 (GeSi) 電吸收調變器 (EAM) 捨棄 MRM，改用具備物理熱強健性的 EAM。在 30°C~80°C 劇烈變化下只需微調偏壓即可穩定運作。	• 單路速率：56 Gb/s (NRZ) • 單組 TX/RX 面積：0.09 mm² • 特性：極低的熱補償功耗

3. 填補市場空白：Coherent-Lite 與極致微型化

除了機架內的極短距互連，隨著 AI 算力基礎設施朝向「分散式園區級架構（Campus-scale）」發展，2 到 40 公里的資料中心互連（DCI）成為了全新的主戰場。

Marvell：輕量化相干（Coherent-Lite）的逆襲

在 2~40 公里的距離下，傳統的強度調變直接檢測（IMDD, 如 PAM-4）傳不遠；而傳統相干通訊（Coherent）雖然傳得遠，但其 DSP 為了處理長距光纖的色散，運算極度複雜，導致功耗過高且延遲極大（通常大於 3 微秒），這對要求低延遲的 AI 訓練是致命傷。

Marvell 此次發表的 5nm 雙通道 800Gb/s Coherent-Lite 收發器，精準切入這個市場痛點。他們專為低色散的 O 波段優化了 DSP 演算法，採用低功耗的 4x4 實數 MIMO 均衡器，大幅減輕了運算負擔。這項改動成功將端到端延遲壓縮至 <300ns，較傳統相干模組降低了一個數量級，完美填補了分散式 AI 園區的互連需求。

UCB / MTK / AyarLabs：打破物理體積限制的單晶片發射器

在追求光互連「微型化」的極限上，UC Berkeley、聯發科與 AyarLabs 聯手交出了顛覆性的成績單。

傳統矽光常用的反偏 PN 結 MZM 調變器體積龐大，長度通常超過 3mm，難以達成極高密度的整合。他們基於 45nm CMOS-SOI 製程，創新地採用了正偏 PIN 型 MZM。PIN 結的調變效率極高，讓調變器長度微縮至僅 0.4mm（晶片面積較傳統縮減 5 倍）。

然而，正偏 PIN 結的物理代價是頻寬極低。為了解決這個致命傷，研發團隊在驅動電路中加入了「被動 RC 均衡」與「發射端預加重（TX-FIR）」技術，硬是把頻寬拉升到足以支援單波長 212Gb/s 16-QAM 相干訊號傳輸的水準，並達成了 0.91 pJ/b 的超高電能效。這展示了透過「先進電路設計」彌補「光學器件物理缺陷」的強大潛力。

總結：光互連已進入「系統級協同設計」的深水區

回顧 ISSCC 2026 的這幾篇重量級文獻，我們可以得出一個清晰的結論：光通訊技術已經跨越了單純依賴「提升雷射或調變器單一元件性能」的階段。

當單通道 400G 逼近矽光的物理極限，未來的勝負，取決於誰能將先進封裝（3D 混合鍵合）、新世代光學材料（TFLN / InP / GeSi）、以及**創新的電路與系統架構（直接驅動、DWDM 濾波、Coherent-Lite）**進行最深度的協同設計（Co-design）。

當 AI 的進步強烈依賴於由數萬顆 GPU 組成的超級大腦時，光互連技術就是連結這些神經元、決定整體智商上限的突觸。3200G 的鐘聲已經敲響，傳統光模組產業鏈正面臨史無前例的技術洗牌。對於關注半導體與通訊基礎設施的投資人與科技從業者而言，這場從底層材料到封裝架構的全方位軍備競賽，才正要進入最精彩的高潮。

1. 頻寬焦慮與材料換代：單通道 400G 將成矽光分水嶺？

2. 決戰 XPU 旁：CPO 與 3D 封裝的百家爭鳴

Broadcom：極致吞吐量與「直接驅動」的架構減法

Nvidia：DWDM 與「半速率時脈轉發」的功耗魔法

Celestial AI：直擊「熱穩定性」痛點的 EAM 調變器

3. 填補市場空白：Coherent-Lite 與極致微型化

Marvell：輕量化相干（Coherent-Lite）的逆襲

UCB / MTK / AyarLabs：打破物理體積限制的單晶片發射器

總結：光互連已進入「系統級協同設計」的深水區