top of page

推動AI資料中心升級的關鍵武器:NVIDIA與Broadcom的CPO解法對決

在 AI 資料中心快速擴張的當下,光互連技術正迎來重大變革。Co-Packaged Optics(CPO)作為下一代高頻寬、低功耗的關鍵技術,正逐步從實驗室走向量產。本文將比較目前兩大領先者 —— NVIDIA 與 Broadcom 在 CPO 領域的策略與技術方案,並解析其背後的系統架構思維與產業影響。


參考文章


為何CPO是未來?

隨著 AI 訓練規模與推論佈局持續擴大,GPU/XPU 之間的互連頻寬需求呈爆炸性成長。傳統 pluggable optics 模組受限於插拔介面、功耗密度與散熱瓶頸,逐漸難以滿足超大規模 AI 系統對高頻寬、低延遲的要求。因此,將光學元件直接整合至交換晶片(Switch ASIC)封裝內的 CPO(Co-Packaged Optics)架構,正成為技術演進的必然趨勢。


然而,CPO 的真正價值不僅在於提升頻寬,更在於有效解決功耗問題。在 AI 大型系統中,傳輸能耗已成為整體系統效率與營運成本的關鍵瓶頸。CPO 架構透過縮短電光轉換距離、消除傳統 I/O 瓶頸,可顯著降低單位位元的傳輸功耗,提升資料中心整體能源效率。


NVIDIA的策略與技術方案

代表產品:CPO Switch(內部稱作 CX7 平台)

  • 封裝觀點為核心:NVIDIA 以系統架構為出發點,強調將 光學互連視為SoC的一部分,而非外掛式模組。所以在NVIDIA的photonics 架構中,可以看到PIC與EIC是用堆疊的方式封裝在一起,真正實現共同封裝的目的,更緊湊,效率更高。但相對的挑戰是封裝上的可量產性。


NVIDIA CPO Switch Structure
NVIDIA CPO Switch Structure

  • CPO 功耗密度佳:透過整合光收發元件,NVIDIA 的 CPO 設計在相同功耗下可達 3倍互連密度提升。簡單地說,採用CPO的設計,一樣的功耗在整體AI運算的系統方案中可以提升三倍的算力空間。


NVIDA Signal Integrity Comparison
NVIDA Signal Integrity Comparison

  • 偏好外掛雷射(external laser):NVIDIA 支持分離式光源架構,以利熱管理與維修。

  • 系統效益優先:強調從平台整合與部署角度來看,投資CPO需從整體TCO與擴充性評估。

🔍 核心理念:每一瓦特功耗代表資料中心的效益,降低傳輸功耗就是降低成本。

Broadcom的策略與技術方案

代表平台:Bailey / Davission CPO

相對於NVIDIA,其實Broadcom提出CPO的概念與進展比較完備也相對成熟,但商業的出發點不同,NVIDIA講究的是算力的總方案。Broadcom則是提出各種網通建設所需要的晶片,包含光電半導體元件雷射與光檢測器。


Broadcom Product Portfolio
Broadcom Product Portfolio


CPO設計改念如下

  • 模組化設計導向:Broadcom以模組商角色出發,提供完整的CPO平台給客戶(如 Microsoft、Meta)進行系統整合。

  • ADK(Assembly Design Kit)完整:聚焦在促進供應鏈規模化,提供製造友善的組裝設計資料。

  • 外掛雷射:同樣是外掛的雷射,但和NVIDIA不同,laser的開發與銷售是Broadcom的老本行。

  • 與 OSAT 合作密切:積極打造 CPO 生態系,串聯光元件、封裝、測試等環節。

📦 核心理念:打造可量產、可交付的 CPO 平台,加速產業採用。

Broadcom CPO Roadmap
Broadcom CPO Roadmap

Broadcom Bailey CPO Latest Test Results
Broadcom Bailey CPO Latest Test Results

NVIDIA vs Broadcom 比較表

項目

NVIDIA

Broadcom

技術導向

系統架構為本、平台整合

模組供應導向、強調製造與交付能力

雷射整合方式

偏好外掛雷射

偏好外掛雷射,掌握雷射關鍵設計

CPO平台

Photonics Switch

Bailey / Davisson

功耗與互連密度

每W功耗提升3倍互連密度

強調低功耗、模組熱管理與BER表現

商業模式

自家平台整合、自製晶片

為第三方客戶(如 hyperscaler)提供模組

推動方式

強調資料中心整體效益與規模擴展

專注於量產設計與供應鏈建立



結語:誰將領先CPO戰場?

NVIDIA 與 Broadcom 雖採取截然不同的策略與市場定位,卻同樣是推動 CPO 技術成熟化的核心力量。


NVIDIA 以其在 AI 生態系中的主導地位,結合強大的平台整合能力,致力於將 CPO 納入整體算力架構設計中。雖然 NVIDIA 已公開推出 CPO 交換機方案,但目前尚未釋出實際測試數據,外界對其性能表現仍充滿關注與期待。


相較之下,Broadcom 聚焦於模組化與供應鏈的規模化運作,從製造端與設計規格著手,推動 CPO 技術加速落地。當 CSP 業者選擇自行開發 ASIC 作為算力核心時,Broadcom 的中立性與完整模組方案,將成為非 NVIDIA 解決方案的重要選項。而 CPO 在功耗與互連密度上的優勢,更使其具備成為未來高效能資料中心核心架構的潛力。


整體而言,這兩家公司無論在技術、資源、還是市場影響力上,都是目前最具實力與話語權的推動者。CPO 發展最大的挑戰過去在於供應鏈的整合與封裝創新,而 NVIDIA 與 Broadcom 的積極投入,有望為業界帶來突破性的進展,讓這項關鍵技術更快實現商業化應用。

Comments


  • Facebook
  • Instagram

©2021 by DRFLYOUT. Proudly created with Wix.com

bottom of page