OCP Global Summit 2025_NVIDIA_Shaping the Future of Open Infrastructure for AI

simpletechtrend
10月15日
讀畢需時 3 分鐘

前言

在 OCP Global Summit 2025 上，NVIDIA 分享了他們如何透過開放基礎設施推動 AI 的未來發展。演講中強調，AI 已經進入 Gigascale 時代 —— 全球各地的資料中心以「GW（Gigawatt）」等級建設，從單一晶片、伺服器，到跨資料中心的超級集群，都需要全新的架構與創新。NVIDIA 在這個過程中不僅是 GPU 的提供者，更是完整 AI 基礎設施生態的推動者。

內容

Gigascale AI 時代

NVIDIA 指出，我們正處於前所未有的 AI 擴展期。資料中心動輒以 GW 級能源投入，建設密集度與技術複雜度創下新高。這些基礎設施已不只是運算中心，而是「會自己變聰明」的資產，隨著軟體與模型的迭代，效能與價值不斷提升 OCP Global Summit 2025_Shaping …。

GPU 與資料中心效能提升

以 B200 與 GB200 資料中心為例，NVIDIA 展示了效能的飛躍：

在短短兩個月內，利用 B200 資料中心將 OpenAI 的 GPTOSS 模型效能提升 5 倍，並將 Token 成本從 每百萬 Token 11 美分降到 2 美分OCP Global Summit 2025_Shaping …。
在另一個案例中，GB200 結合 NVL72 架構，在 DeepSeek R1 模型上的效能比 H200 高出 15 倍，直接轉化為營收效益OCP Global Summit 2025_Shaping …。

這些例子說明，硬體效能提升與網路優化不僅是技術突破，更是商業模式的推動力。

下一代架構：Vera Rubin

NVIDIA 公布了即將在 2026 下半年登場的 Vera Rubin 架構：

採用 雙晶片設計：CPX 處理器負責上下文處理，搭配 Rubin GPU 提供超過 8 Exaflops 的推理效能。
網路進入 400G Scale-up 時代，總頻寬達 260 TB/s，是 GB200 的兩倍OCP Global Summit 2025_Shaping …。
100% 液冷 OCP MGX 相容設計，延續現有的 45°C 進風溫度規格，降低冷卻基建成本。
新的 500A 液冷匯流排，提升能源效率，並提供更高的韌性與可擴展性。

NVLink Fusion 與多元合作

NVIDIA 推出 NVLink Fusion，讓異質處理器能與 GPU 深度整合：

Fujitsu Monaka CPU 已透過 NVLink Fusion 與 GPU 相連。
Intel 也將推出支援 NVLink Fusion 的 CPU，進一步擴大生態圈。
其他合作夥伴還包括 Alchip、三星、聯發科等，共同建構開放式異質運算環境OCP Global Summit 2025_Shaping …。

SpectrumX 與跨資料中心互連

隨著 AI 集群規模擴展到 百萬 GPU 等級，Ethernet 與 SpectrumX 成為關鍵：

Microsoft 的 Fairwater 超級電腦，已經在 OCP Sonic 架構上使用 SpectrumX。
Oracle 的 Stargate 資料中心，則透過 OCP 與 SpectrumX 打造 95% 有效頻寬的互連架構。
NVIDIA 宣布 Spectrum XGX，可支援跨資料中心、跨地理位置的 AI 訓練OCP Global Summit 2025_Shaping …。

未來展望：Kyber 架構

2027 下半年，NVIDIA 將推出 Kyber：

單一機架可整合 576 顆 GPU。
結合 800V DC 電源基礎設施，以應對極端能源密度需求。
這將進一步把 AI 訓練推向超大規模OCP Global Summit 2025_Shaping …。

總結

NVIDIA 在這次演講中清楚傳達一個訊息：AI 基礎設施的演進，不只是 GPU 效能疊加，而是跨晶片、跨資料中心的全棧創新。 從 Vera Rubin 到 Kyber，NVIDIA 正透過 OCP 與產業合作，把 Gigascale AI 的未來基礎設施鋪好。

延伸觀點

技術影響：Vera Rubin 的雙晶片設計與 400G Scale-up 網路，顯示未來 AI 架構將高度依賴 矽光子互連，才能突破銅線與能耗瓶頸。
供應鏈觀察：NVLink Fusion 的開放，將影響 CPU 與 GPU 的關係格局，對 Intel、AMD 甚至 ARM 生態都帶來機會。光模組與 SiPh 廠商（如 Broadcom、Marvell、InnoLight）將從 SpectrumX 部署中受惠。
市場趨勢：隨著 Kyber 機架單櫃 GPU 數量翻倍，AI 資料中心 CAPEX 與能源需求會持續攀升。這將推動 液冷、800V DC 配電、矽光子光互連 成為主流，並帶動產業新一波投資。