top of page

OCP Global Summit 2025_Astera Labs_Scaling AI with PCIe, Ethernet, and UALink Retimers

前言

在今年的 OCP Global Summit 中,Astera Labs 帶來的主題「Scaling AI with PCIe, Ethernet, and UALink Retimers」不僅是產品發表,更是一場關於 AI Infrastructure 2.0 架構演進的宣言

隨著 AI 模型規模爆炸式增長,Astera 強調:

「伺服器不再是運算單位,整個機架(Rack)才是新的計算單元。」

這場演講由 Anchul Sharma 與 Chris Blackburn 主講,完整展示 Astera 如何從 晶片設計、互連協定到軟體管理生態,打造支撐未來 AI 架構的開放式互連基礎。


內容

1. Astera 的使命:為 AI 建立智能互連

Astera 開場就定義了自己的定位:

「我們不只是作通用連接晶片,而是專為 AI 工作負載設計的智能互連平台。」

他們的產品橫跨三個層面:

  1. ICs/Boards/Modules:包括 Retimer、Gearbox、I/O Chiplets、AI Fabric Switch;

  2. Smart Cable Modules:將信號調整電路整合進主動電纜中(AEC),降低系統延遲與布線複雜度;

  3. Cosmos 軟體平台:Astera 的軟體定義管理層,提供全機架的診斷、監控與自動化操作。

Cosmos 被視為 Astera 的「AI Fabric 腦中樞」,能在多協定環境(PCIe、CXL、Ethernet、UALink)中統一控制並優化連線行為。


2. AI Infrastructure 2.0:Rack 即是新運算單位

Astera 提出一個清晰的分界:

架構

定義

特徵

AI Infrastructure 1.0

伺服器為基本單位

單機 4–8 GPU,透過以太網連線

AI Infrastructure 2.0

機架為基本單位

上百個 GPU 以高頻寬低延遲 Fabric 相互連結

這個轉變意味著傳統的 Scale-Out 以太網連線已不足以支撐大型 AI 模型的訓練,

必須導入專為 GPU-to-GPU 通訊設計的 Scale-Up Fabric(如 UALink、NVLink、CXL 互連)

Astera 認為,在這個新時代:

「機架不再是伺服器的集合,而是被視為一台超級電腦。」

他們的目標是建立開放式、標準化的 Rack-Scale 架構,讓 OEM 與 Hyperscaler 能以模組化方式整合各家元件。


3. 四大支柱:Astera 的 Rack-Scale 策略

Astera 的架構願景圍繞四個核心原則:

  1. 支援開放標準(Open Standards)

    • 涵蓋 PCIe、CXL、Ethernet、UALink。

    • 提倡開放協作而非封閉生態。

  2. 智慧軟體層(Intelligent Software)

    • Cosmos 作為跨協定管理平台,提供診斷、監控與自動配置。

  3. 多協定支援(Multi-Protocol Flexibility)

    • 可根據應用在 Rack 內或 Rack 間自由切換 PCIe / CXL / Ethernet / UALink。

  4. 專用產品組合(Purpose-Built Portfolio)

    • Aries 系列(PCIe Retimer / Gearbox)

    • Taurus 系列(Ethernet Retimer)

    • Leo 系列(CXL Memory Controller)

    • Scorpio 系列(AI Fabric Switch)


4. 核心產品與角色

(1) Aries Smart PCIe Retimer / Gearbox

  • 已在 PCIe Gen4/Gen5 大量部署於主流 AI 平台;

  • 新一代 Gen6 Retimer 已進入高量產階段,性能與可靠性優於競爭對手;

  • Gearbox 版本 可橋接 Gen6 與 Gen5 系統,解決速率不匹配問題。

(2) Taurus Smart DSP Retimer (Ethernet)

  • 速率範圍從 100G → 800G;

  • 支援主動電纜與模組整合;

  • 為 AI Scale-Out 網路(如 Data Center Interconnect)設計。

(3) Leo CXL Smart Memory Controller

  • 提供記憶體池化(Memory Pooling)與擴展功能;

  • 讓 GPU 能更有效率地存取分散式記憶體。

(4) Scorpio AI Fabric Switch (P / X 系列)

  • P 系列:處理混合流量(GPU ↔ SSD、NIC);

  • X 系列:針對高密度 GPU Fabric 優化,支援 Scale-Up 應用。

  • 為 Astera 成長最快的產品線,成為 UALink 實作的關鍵元件。


5. Open Rack Reference Platform

在展示區,Astera 佈署了名為 Open Rack 的參考架構:

  • XPU Tray:整合 GPU、CPU、SSD、NIC;

  • PCIe Switch Board:採用 Scorpio P 系列 連接各裝置;

  • Scale-Up Switch:使用 Scorpio X 系列 打造高頻寬 GPU Fabric;

  • Retimer 與 Gearbox 佈局於主板與背板之間,確保訊號完整性。

Astera 指出,這個設計並非單一品牌方案,而是一個 可擴充的開放藍圖

任何廠商都能基於這套參考設計開發自家機架。


6. 模組化與服務性設計

演講最後,Astera 強調一個重要趨勢:Server Modularity & Serviceability

  • Retimer、Switch、Cable Module 將以獨立模組形式存在;

  • 可依需求以 card-edge、mezzanine、backplane 或 near-chip 方式組裝;

  • 讓機架維修與升級更快速,同時降低供應鏈風險。

Astera 的策略是讓所有關鍵互連元件都具「可插拔」與「可標準化」特性,

進一步推動開放式 AI Infrastructure 2.0 的形成。


總結

Astera 在 OCP 2025 傳達了一個清晰訊號:

AI Infrastructure 2.0 的核心,不是 GPU 數量,而是互連的智慧與開放。

Astera 已從「Retimer 晶片供應商」進化為「AI Fabric 平台商」,

透過 PCIe、Ethernet、CXL、UALink 的協同整合,

他們正引領業界邁向可組合、可標準化的開放式 AI 機架架構。


延伸觀點

  1. 技術意涵

    • Astera 正在建立「跨協定互連整合層」,類似未來的 AI Fabric BIOS。

    • Cosmos 平台代表硬體層互連的軟體化趨勢,是 Rack-level Automation 的雛形。

  2. 供應鏈觀察

    • Astera 的開放模組策略,將重塑 Retimer、Switch、Cable 模組供應鏈結構。

    • 透過與 UALink、OCP、CXL 聯盟的合作,它已逐步嵌入主流 AI 伺服器生態。

  3. 市場趨勢

    • AI Infrastructure 2.0 將成為未來三年的產業主軸。

    • 「Rack = Compute Unit」的概念將推動新一波 AI SuperRack 標準化浪潮

最新文章

查看全部
OCP Global Summit 2025_Astera Labs_Trust at 64 GT/s: Security Considerations for PCIe 6 Switch Deployments

前言 在 AI 資料中心與高頻寬計算快速擴張的背景下, PCIe 6.0  已成為關鍵的互連主幹。而隨著速率提升至  64 GT/s 、通道數暴增,連接範圍從伺服器延伸到整個機架甚至多機架, 安全性問題  成為設計中不可忽視的挑戰。 在 OCP 2025, Astera Labs  的技術長 Abdeshavia 帶來的主題演講—— 「Trust at 64 GT/s」 ,針對 PCIe Gen6

 
 
 
OCP Global Summit 2025_Astera Labs_Beyond the Spec: What it Takes to Deploy UALink at Rack Scale

前言 在今年的 OCP Global Summit 中, Astera Labs  帶來一場極具戰略意義的分享: 如何在實際機架(Rack)層面部署 UALink 。 這場演講不僅談到協定與晶片層面的發展,更聚焦於「 從 IP → 晶片 → 板卡 → 機架 → 軟體管理 → 安全性 → 互通驗證 」的全流程實踐。 對 Astera 來說,UALink 不只是一個規格,而是一個完整的  開放 Sca

 
 
 
OCP Global Summit 2025_Lotes_Copper Interconnect in 200G Scale-Up Networks

前言 在光互連(Optical Interconnect)逐漸主導 AI 基礎設施討論的時代, Lotes  在 OCP 2025 的分享反而回到了「電」的核心—— 銅互連 (Copper Interconnect) 。 演講者 Raymond Law 強調自己「不是光學人,而是信號完整性工程師」,並希望在這場充滿光模組展示的會議中,提醒大家: 「在 200G 時代,銅線仍然能發揮關鍵作用,甚至在

 
 
 

留言


  • Facebook
  • Instagram

©2021 by DRFLYOUT. Proudly created with Wix.com

bottom of page