技術文章分析 | A Symmetrical, Wavelength Agnostic, Bidirectional, Silicon-Photonic Link Proposal and Demonstration| NVIDIA

9分钟前
讀畢需時 4 分鐘

在 AI 算力大爆發的時代，GPU 叢集的規模呈現指數級增長，這讓網路交換器（Switch）的埠數（Radix）面臨了巨大的挑戰。雖然近期熱門的共封裝光學（CPO）技術能省下不少功耗與成本，但 CPO 基板邊緣的「海岸線（Beach-front）」物理空間有限，嚴重卡死了埠數的擴充性。

要怎麼在不增加海岸線的情況下讓傳輸量翻倍？「雙向傳輸（BiDi）」無疑是不錯的解法，它不僅能讓系統埠數翻倍，還能直接把每位元的光纖連接成本砍半。但傳統的 BiDi 方案要嘛太貴，要嘛太麻煩。今天我們要來拆解 NVIDIA 發表的一篇新論文，他們利用了 65nm 矽光子製程，提出了一種「硬體對稱、無關波長」的偏振多工雙向傳輸架構。簡單來說，他們做出了讓兩端設備長得一模一樣，不用區分「波長顏色」就能雙向高速溝通的超強技術！

論文基本資訊

論文標題： A Symmetrical, Wavelength Agnostic, Bidirectional, Silicon-Photonic Link Proposal and Demonstration
作者： SHAI COHEN, LIRON GANTZ, SEGEV ZARKOVSKY, RONI BAR, HANANEL FAIG, BENJAMIN G. LEE AND C. THOMAS GRAY
發表單位： NVIDIA Corporation

深度圖表分析：透視 NVIDIA 的技術奧祕

這篇論文最精華的地方就在於它的架構設計與驗證方法，我們直接看圖說故事：

Figure 1：三種 BiDi 架構大 PK

這張圖點出了目前業界的痛點，以及為什麼 NVIDIA 要提出新架構：

(A) 傳統環形器 (Circulators) 架構： 雖然可以讓兩端設備（Alice 與 Bob）保持一致，但環形器會大幅增加封裝複雜度與元件成本。
(B) 波長多工 (Color-based) 架構： 這是目前常見的做法，利用矽光子整合的波長多工器（MUX），分配不同的波長給上行與下行鏈路。但這會導致嚴重的實務問題：兩端設備必須被「上色（Color-coding）」（例如一端發紅光收綠光，另一端發綠光收紅光），這逼迫網路設計師必須提前規畫好所有的連接方式，甚至要準備多種 Switch 版本，庫存管理簡直是噩夢。
(C) 偏振多工 (Polarization MUX) 架構： 這就是本文的殺手鐧。透過偏振態來區分上下行，兩端設備都可以做到完全 identical（無顏色區分）。因為在任何標準單模光纖 (SMF) 的 BiDi 方案中，兩端本來就都必須具備接收兩種偏振態的能力，所以不如直接拿它來做雙向傳輸！

Figure 2：偏振追蹤的數學與架構魔法

這裡 NVIDIA 解釋了為什麼兩端設備可以做到完全對稱：

理論基礎： 光在單模光纖中傳輸時的偏振變化可以用 SU(2) Jones 轉換矩陣來描述。
解碼機制： 當接收端（Bob）的偏振追蹤器完美補償了通道的相對相位差並旋轉狀態後，整個通道的轉移矩陣會變成嚴格的「反對角矩陣（Anti-diagonal matrix）」。
雙向完美映射： 透過矩陣運算可以發現，這個反對角矩陣的共軛轉置依然是反對角矩陣。這意味著，Alice 發出的訊號會 100% 跑到 Bob 的接收埠；反之，Bob 發出的訊號也會 100% 跑回 Alice 的接收埠，完美實現交叉連接。
對稱硬體設計： 圖 2.B 展示了只要在兩端都放入偏振追蹤器（其中一邊主動追蹤，另一邊閒置），就能讓硬體完全對稱，從此告別惱人的「波長配對」問題。

Figure 3：實驗架設

為了證明這不是紙上談兵，團隊搭建了驗證平台：

硬體配置： Alice 與 Bob 都採用了相同的物理架構，透過 2D 耦合光柵 (2D GC) 連接單模光纖 (SMF) 。
測試條件： 兩端獨立注入 32 Gbps NRZ (PRBS15) 的訊號，使用 1299nm 波長。
擾動模擬： 中間加入了一台偏振擾頻器（Polarization scrambler），模擬真實世界中光纖受到的動態干擾。Alice 透過控制器不斷動態調整熱光相位偏移器 (TOPS) 來最大化接收功率，而 Bob 則保持閒置。

Figure 4：模擬嚴苛的偏振擾動環境

為了證明追蹤器夠快，圖 4 秀出了他們給通道施加的「酷刑」指標：

(A) 擾動頻譜： 量測出的擾動功率頻譜密度 (PSD) 呈現頻寬受限的「白噪音」特性，其 3dB 頻率達到 42Hz 。
(B) 角速度統計： 偏振角速度的機率密度函數 (PDF) 顯示，平均轉速高達 94.5 rad/s，而 95 百分位數更是來到了 161.4 rad/s 。這代表追蹤器必須在極快速的偏振變動下依然穩如泰山。

Figure 5：32 Gbps 實測成績單

實驗結果非常漂亮：

(A) & (B) 浴缸曲線 (Bathtub Curves)： 顯示了雙向（Tx1->Rx2 與 Tx2->Rx1）在 32 Gbps 速率下，同時傳輸的誤碼率 (BER) 都能低於 1e-11 。兩條曲線的微小差異純粹是因為兩端使用了不同廠牌的調變器。
(C) & (D) 眼圖 (Eye Diagrams)： 兩方向的眼圖都非常清晰且大開，進一步驗證了無失真傳輸。
額外亮點： 團隊還把 Bob 的雷射切換到 1299.5nm，效能依然沒有衰退，證明了這套架構真的是「波長無關（Wavelength Agnostic）」。且 TOPS 的功耗低於 50mW，每組追蹤器的插入損耗也僅約 0.25dB 。

結論：AI 算力網路的無色化未來

NVIDIA 的這項研究漂亮地展示了如何在 65nm 矽光子製程上，用偏振多工打通單模光纖的雙向任督二脈。透過將控制機制與資料傳輸速率脫鉤（只依賴接收功率來調校），這項技術未來完全可以無縫接軌到更複雜的調變格式與不同的雷射網格上。

對於未來的 AI 資料中心而言，這意味著我們可以在不增加 Switch 封裝邊緣負擔的前提下，讓交換埠數直接翻倍、光纖成本直接減半。更重要的是，「兩端硬體完全一致」的特性，將徹底解決網路規畫者在部署設備與庫存管理上的頭痛問題。這絕對是未來 CPO 與高密度光通訊的一條康莊大道！