CES2026 NVIDIA Vera Rubin 架構 中各項關鍵晶片與技術的規格說明
- 1月6日
- 讀畢需時 3 分鐘
根據 NVIDIA 執行長黃仁勳在 CES 2026 的演講內容,以及相關技術細節,以下為詳細整理 Vera Rubin 架構 中各項關鍵晶片與技術的規格說明。
這是一個「Extreme Co-design(極限協同設計)」的產物,NVIDIA 為了打破摩爾定律的物理限制,選擇一次性重新設計了系統中的所有 6 款關鍵晶片。
1. Vera CPU:專為 AI 協作設計的超級核心
這顆 CPU 是為了配合強大的 GPU 而生,不再是通用的 ARM 核心,而是高度客製化的。
核心架構:擁有 88 個物理核心(High-performance cores)。
執行緒 (Threads):支援 176 個執行緒(SMT, Simultaneous Multi-Threading),設計上讓每個執行緒都能獲得接近物理核心的效能。
效能提升:相比前代 Grace CPU,效能提升 2 倍,且每瓦效能(Performance per Watt)也提升 2 倍。
定位:專門處理 AI 系統中的數據預處理與協調工作,解決傳統 CPU 在 AI 負載下的瓶頸。

2. Rubin GPU:打破物理限制的 AI 引擎
這是整個架構的心臟,由兩顆晶片(Dies)封裝而成。
運算效能:
AI 訓練效能:Blackwell 的 3.5 倍。
AI 推論效能:Blackwell 的 5 倍。
電晶體數量:僅為 Blackwell 的 1.6 倍(在電晶體僅增加 60% 的情況下,透過架構創新實現 5 倍效能增長)。
關鍵技術:NVFP4 Tensor Core
並非簡單的 4-bit:傳統 FP4 精度太低,容易失真。NVFP4 是一個完整的處理單元。
動態適應 (Adaptive Precision):它能根據模型層級的需求,動態調整精度與結構(Block-wise scaling)。在不需要高精度的地方使用極低位元(4-bit)跑出極高吞吐量,關鍵時刻切回高精度,實現「速度與準確度」的兼得。
製造工藝:採用 TSMC 客製化的 CoWoS-L 封裝與先進製程(如 N3P)。

3. NVLink 6 Switch:超越互聯網頻寬的數據高速公路
為了讓 72 顆 GPU 像「一顆巨型 GPU」一樣運作,交換器是關鍵。
單晶片規格:單一 Switch 晶片擁有 400 Gbps 的超高速 SerDes(序列解序列器),是目前主流速度的兩倍。
機架級頻寬:在 NVL72 機架背板上,提供高達 240 TB/s 的橫切面頻寬(Cross-sectional Bandwidth)。
概念對比:這相當於全球網際網路總流量(約 100 TB/s)的 2 倍以上。
目的:確保每顆 GPU 都能以全速同時與其他 72 顆 GPU 通訊,無阻塞。

4. ConnectX-9 SuperNIC:極速網路介面
這是負責機架與外部世界溝通的網卡(NIC),專為 AI 的東西向流量(East-West Traffic)優化。
吞吐量:高達 1.6 Tbps(Terabits per second)。
協同設計:與 Vera CPU 深度整合,專門處理 AI 運算中的 RDMA(遠端記憶體存取)與數據路徑加速,釋放 CPU 資源。

5. BlueField-4 DPU 與「無限記憶體」架構
這是本次演講最重大的架構變革之一,旨在解決長文本(Long Context)帶來的 KV Cache 瓶頸。
規格:整合了 Grace 等級的 CPU 核心與 ConnectX-9 IP,吞吐量達 800 Gbps - 1.6 Tbps。
革命性功能:Inference Context Memory Storage
背景:AI 對話越長,KV Cache(上下文記憶)越大,GPU 的 HBM 記憶體裝不下。
解決方案:在機架內配置由 BlueField-4 管理的 150 TB 共享記憶體池。
效果:透過 BlueField-4 的高速搬運,每顆 Rubin GPU 除了自身的 HBM 外,還額外獲得 16 TB 的極速存取記憶體,讓 AI 能夠「記住」一輩子的對話內容。

6. Spectrum-X Ethernet Switch (Silicon Photonics)
這是全球首款採用 COUPE (Co-packaged Optics) 矽光子技術的 AI 乙太網路交換器。
規格:單晶片提供 512 個 200 Gbps 埠。
技術亮點:
雷射直接入晶片 (Lasers come in):光纖不再是插在交換器面板上,而是直接連接到晶片封裝上。
優勢:大幅降低訊號傳輸的功耗與延遲,適合連接成千上萬個機架的超大型 AI 工廠。




總結:Vera Rubin NVL72 機架規格
將上述所有晶片整合在一個機架中,就是 Vera Rubin NVL72:
GPU:72 顆 Rubin GPU。
CPU:36 顆 Vera CPU。
散熱:100% 液冷,進水溫度 45°C(熱水冷卻),無需耗電的冰水機(Chillers)。
重量:約 2.5 噸(含冷卻液)。
組裝:零線纜(Zero Cables)盲插設計,組裝時間從 2 小時縮短至 5 分鐘。
這套規格展示了 NVIDIA 試圖用「堆疊創新(Full-stack Innovation)」來強行延續運算效能的摩爾定律。





留言