top of page

OCP Global Summit 2025_Astera Labs_Scaling AI with PCIe, Ethernet, and UALink Retimers

  • 2025年11月3日
  • 讀畢需時 4 分鐘

前言

在今年的 OCP Global Summit 中,Astera Labs 帶來的主題「Scaling AI with PCIe, Ethernet, and UALink Retimers」不僅是產品發表,更是一場關於 AI Infrastructure 2.0 架構演進的宣言

隨著 AI 模型規模爆炸式增長,Astera 強調:

「伺服器不再是運算單位,整個機架(Rack)才是新的計算單元。」

這場演講由 Anchul Sharma 與 Chris Blackburn 主講,完整展示 Astera 如何從 晶片設計、互連協定到軟體管理生態,打造支撐未來 AI 架構的開放式互連基礎。


內容

1. Astera 的使命:為 AI 建立智能互連

Astera 開場就定義了自己的定位:

「我們不只是作通用連接晶片,而是專為 AI 工作負載設計的智能互連平台。」

他們的產品橫跨三個層面:

  1. ICs/Boards/Modules:包括 Retimer、Gearbox、I/O Chiplets、AI Fabric Switch;

  2. Smart Cable Modules:將信號調整電路整合進主動電纜中(AEC),降低系統延遲與布線複雜度;

  3. Cosmos 軟體平台:Astera 的軟體定義管理層,提供全機架的診斷、監控與自動化操作。

Cosmos 被視為 Astera 的「AI Fabric 腦中樞」,能在多協定環境(PCIe、CXL、Ethernet、UALink)中統一控制並優化連線行為。


2. AI Infrastructure 2.0:Rack 即是新運算單位

Astera 提出一個清晰的分界:

架構

定義

特徵

AI Infrastructure 1.0

伺服器為基本單位

單機 4–8 GPU,透過以太網連線

AI Infrastructure 2.0

機架為基本單位

上百個 GPU 以高頻寬低延遲 Fabric 相互連結

這個轉變意味著傳統的 Scale-Out 以太網連線已不足以支撐大型 AI 模型的訓練,

必須導入專為 GPU-to-GPU 通訊設計的 Scale-Up Fabric(如 UALink、NVLink、CXL 互連)

Astera 認為,在這個新時代:

「機架不再是伺服器的集合,而是被視為一台超級電腦。」

他們的目標是建立開放式、標準化的 Rack-Scale 架構,讓 OEM 與 Hyperscaler 能以模組化方式整合各家元件。


3. 四大支柱:Astera 的 Rack-Scale 策略

Astera 的架構願景圍繞四個核心原則:

  1. 支援開放標準(Open Standards)

    • 涵蓋 PCIe、CXL、Ethernet、UALink。

    • 提倡開放協作而非封閉生態。

  2. 智慧軟體層(Intelligent Software)

    • Cosmos 作為跨協定管理平台,提供診斷、監控與自動配置。

  3. 多協定支援(Multi-Protocol Flexibility)

    • 可根據應用在 Rack 內或 Rack 間自由切換 PCIe / CXL / Ethernet / UALink。

  4. 專用產品組合(Purpose-Built Portfolio)

    • Aries 系列(PCIe Retimer / Gearbox)

    • Taurus 系列(Ethernet Retimer)

    • Leo 系列(CXL Memory Controller)

    • Scorpio 系列(AI Fabric Switch)


4. 核心產品與角色

(1) Aries Smart PCIe Retimer / Gearbox

  • 已在 PCIe Gen4/Gen5 大量部署於主流 AI 平台;

  • 新一代 Gen6 Retimer 已進入高量產階段,性能與可靠性優於競爭對手;

  • Gearbox 版本 可橋接 Gen6 與 Gen5 系統,解決速率不匹配問題。

(2) Taurus Smart DSP Retimer (Ethernet)

  • 速率範圍從 100G → 800G;

  • 支援主動電纜與模組整合;

  • 為 AI Scale-Out 網路(如 Data Center Interconnect)設計。

(3) Leo CXL Smart Memory Controller

  • 提供記憶體池化(Memory Pooling)與擴展功能;

  • 讓 GPU 能更有效率地存取分散式記憶體。

(4) Scorpio AI Fabric Switch (P / X 系列)

  • P 系列:處理混合流量(GPU ↔ SSD、NIC);

  • X 系列:針對高密度 GPU Fabric 優化,支援 Scale-Up 應用。

  • 為 Astera 成長最快的產品線,成為 UALink 實作的關鍵元件。


5. Open Rack Reference Platform

在展示區,Astera 佈署了名為 Open Rack 的參考架構:

  • XPU Tray:整合 GPU、CPU、SSD、NIC;

  • PCIe Switch Board:採用 Scorpio P 系列 連接各裝置;

  • Scale-Up Switch:使用 Scorpio X 系列 打造高頻寬 GPU Fabric;

  • Retimer 與 Gearbox 佈局於主板與背板之間,確保訊號完整性。

Astera 指出,這個設計並非單一品牌方案,而是一個 可擴充的開放藍圖

任何廠商都能基於這套參考設計開發自家機架。


6. 模組化與服務性設計

演講最後,Astera 強調一個重要趨勢:Server Modularity & Serviceability

  • Retimer、Switch、Cable Module 將以獨立模組形式存在;

  • 可依需求以 card-edge、mezzanine、backplane 或 near-chip 方式組裝;

  • 讓機架維修與升級更快速,同時降低供應鏈風險。

Astera 的策略是讓所有關鍵互連元件都具「可插拔」與「可標準化」特性,

進一步推動開放式 AI Infrastructure 2.0 的形成。


總結

Astera 在 OCP 2025 傳達了一個清晰訊號:

AI Infrastructure 2.0 的核心,不是 GPU 數量,而是互連的智慧與開放。

Astera 已從「Retimer 晶片供應商」進化為「AI Fabric 平台商」,

透過 PCIe、Ethernet、CXL、UALink 的協同整合,

他們正引領業界邁向可組合、可標準化的開放式 AI 機架架構。


延伸觀點

  1. 技術意涵

    • Astera 正在建立「跨協定互連整合層」,類似未來的 AI Fabric BIOS。

    • Cosmos 平台代表硬體層互連的軟體化趨勢,是 Rack-level Automation 的雛形。

  2. 供應鏈觀察

    • Astera 的開放模組策略,將重塑 Retimer、Switch、Cable 模組供應鏈結構。

    • 透過與 UALink、OCP、CXL 聯盟的合作,它已逐步嵌入主流 AI 伺服器生態。

  3. 市場趨勢

    • AI Infrastructure 2.0 將成為未來三年的產業主軸。

    • 「Rack = Compute Unit」的概念將推動新一波 AI SuperRack 標準化浪潮

最新文章

查看全部
OCP Global Summit 2025_Astera Labs_Trust at 64 GT/s: Security Considerations for PCIe 6 Switch Deployments

前言 在 AI 資料中心與高頻寬計算快速擴張的背景下, PCIe 6.0  已成為關鍵的互連主幹。而隨著速率提升至  64 GT/s 、通道數暴增,連接範圍從伺服器延伸到整個機架甚至多機架, 安全性問題  成為設計中不可忽視的挑戰。 在 OCP 2025, Astera Labs  的技術長 Abdeshavia 帶來的主題演講—— 「Trust at 64 GT/s」 ,針對 PCIe Gen6

 
 
 
OCP Global Summit 2025_Astera Labs_Beyond the Spec: What it Takes to Deploy UALink at Rack Scale

前言 在今年的 OCP Global Summit 中, Astera Labs  帶來一場極具戰略意義的分享: 如何在實際機架(Rack)層面部署 UALink 。 這場演講不僅談到協定與晶片層面的發展,更聚焦於「 從 IP → 晶片 → 板卡 → 機架 → 軟體管理 → 安全性 → 互通驗證 」的全流程實踐。 對 Astera 來說,UALink 不只是一個規格,而是一個完整的  開放 Sca

 
 
 
OCP Global Summit 2025_Lotes_Copper Interconnect in 200G Scale-Up Networks

前言 在光互連(Optical Interconnect)逐漸主導 AI 基礎設施討論的時代, Lotes  在 OCP 2025 的分享反而回到了「電」的核心—— 銅互連 (Copper Interconnect) 。 演講者 Raymond Law 強調自己「不是光學人,而是信號完整性工程師」,並希望在這場充滿光模組展示的會議中,提醒大家: 「在 200G 時代,銅線仍然能發揮關鍵作用,甚至在

 
 
 

留言


  • Facebook
  • Instagram

©2021 by DRFLYOUT. Proudly created with Wix.com

bottom of page