OCP Global Summit 2025_Astera Labs_Scaling AI with PCIe, Ethernet, and UALink Retimers
- simpletechtrend
- 11月3日
- 讀畢需時 4 分鐘
前言
在今年的 OCP Global Summit 中,Astera Labs 帶來的主題「Scaling AI with PCIe, Ethernet, and UALink Retimers」不僅是產品發表,更是一場關於 AI Infrastructure 2.0 架構演進的宣言。
隨著 AI 模型規模爆炸式增長,Astera 強調:
「伺服器不再是運算單位,整個機架(Rack)才是新的計算單元。」
這場演講由 Anchul Sharma 與 Chris Blackburn 主講,完整展示 Astera 如何從 晶片設計、互連協定到軟體管理生態,打造支撐未來 AI 架構的開放式互連基礎。
內容
1. Astera 的使命:為 AI 建立智能互連
Astera 開場就定義了自己的定位:
「我們不只是作通用連接晶片,而是專為 AI 工作負載設計的智能互連平台。」
他們的產品橫跨三個層面:
ICs/Boards/Modules:包括 Retimer、Gearbox、I/O Chiplets、AI Fabric Switch;
Smart Cable Modules:將信號調整電路整合進主動電纜中(AEC),降低系統延遲與布線複雜度;
Cosmos 軟體平台:Astera 的軟體定義管理層,提供全機架的診斷、監控與自動化操作。
Cosmos 被視為 Astera 的「AI Fabric 腦中樞」,能在多協定環境(PCIe、CXL、Ethernet、UALink)中統一控制並優化連線行為。
2. AI Infrastructure 2.0:Rack 即是新運算單位
Astera 提出一個清晰的分界:
架構 | 定義 | 特徵 |
AI Infrastructure 1.0 | 伺服器為基本單位 | 單機 4–8 GPU,透過以太網連線 |
AI Infrastructure 2.0 | 機架為基本單位 | 上百個 GPU 以高頻寬低延遲 Fabric 相互連結 |
這個轉變意味著傳統的 Scale-Out 以太網連線已不足以支撐大型 AI 模型的訓練,
必須導入專為 GPU-to-GPU 通訊設計的 Scale-Up Fabric(如 UALink、NVLink、CXL 互連)。
Astera 認為,在這個新時代:
「機架不再是伺服器的集合,而是被視為一台超級電腦。」
他們的目標是建立開放式、標準化的 Rack-Scale 架構,讓 OEM 與 Hyperscaler 能以模組化方式整合各家元件。
3. 四大支柱:Astera 的 Rack-Scale 策略
Astera 的架構願景圍繞四個核心原則:
支援開放標準(Open Standards)
涵蓋 PCIe、CXL、Ethernet、UALink。
提倡開放協作而非封閉生態。
智慧軟體層(Intelligent Software)
Cosmos 作為跨協定管理平台,提供診斷、監控與自動配置。
多協定支援(Multi-Protocol Flexibility)
可根據應用在 Rack 內或 Rack 間自由切換 PCIe / CXL / Ethernet / UALink。
專用產品組合(Purpose-Built Portfolio)
Aries 系列(PCIe Retimer / Gearbox)
Taurus 系列(Ethernet Retimer)
Leo 系列(CXL Memory Controller)
Scorpio 系列(AI Fabric Switch)
4. 核心產品與角色
(1) Aries Smart PCIe Retimer / Gearbox
已在 PCIe Gen4/Gen5 大量部署於主流 AI 平台;
新一代 Gen6 Retimer 已進入高量產階段,性能與可靠性優於競爭對手;
Gearbox 版本 可橋接 Gen6 與 Gen5 系統,解決速率不匹配問題。
(2) Taurus Smart DSP Retimer (Ethernet)
速率範圍從 100G → 800G;
支援主動電纜與模組整合;
為 AI Scale-Out 網路(如 Data Center Interconnect)設計。
(3) Leo CXL Smart Memory Controller
提供記憶體池化(Memory Pooling)與擴展功能;
讓 GPU 能更有效率地存取分散式記憶體。
(4) Scorpio AI Fabric Switch (P / X 系列)
P 系列:處理混合流量(GPU ↔ SSD、NIC);
X 系列:針對高密度 GPU Fabric 優化,支援 Scale-Up 應用。
為 Astera 成長最快的產品線,成為 UALink 實作的關鍵元件。
5. Open Rack Reference Platform
在展示區,Astera 佈署了名為 Open Rack 的參考架構:
XPU Tray:整合 GPU、CPU、SSD、NIC;
PCIe Switch Board:採用 Scorpio P 系列 連接各裝置;
Scale-Up Switch:使用 Scorpio X 系列 打造高頻寬 GPU Fabric;
Retimer 與 Gearbox 佈局於主板與背板之間,確保訊號完整性。
Astera 指出,這個設計並非單一品牌方案,而是一個 可擴充的開放藍圖,
任何廠商都能基於這套參考設計開發自家機架。
6. 模組化與服務性設計
演講最後,Astera 強調一個重要趨勢:Server Modularity & Serviceability。
Retimer、Switch、Cable Module 將以獨立模組形式存在;
可依需求以 card-edge、mezzanine、backplane 或 near-chip 方式組裝;
讓機架維修與升級更快速,同時降低供應鏈風險。
Astera 的策略是讓所有關鍵互連元件都具「可插拔」與「可標準化」特性,
進一步推動開放式 AI Infrastructure 2.0 的形成。
總結
Astera 在 OCP 2025 傳達了一個清晰訊號:
AI Infrastructure 2.0 的核心,不是 GPU 數量,而是互連的智慧與開放。
Astera 已從「Retimer 晶片供應商」進化為「AI Fabric 平台商」,
透過 PCIe、Ethernet、CXL、UALink 的協同整合,
他們正引領業界邁向可組合、可標準化的開放式 AI 機架架構。
延伸觀點
技術意涵
Astera 正在建立「跨協定互連整合層」,類似未來的 AI Fabric BIOS。
Cosmos 平台代表硬體層互連的軟體化趨勢,是 Rack-level Automation 的雛形。
供應鏈觀察
Astera 的開放模組策略,將重塑 Retimer、Switch、Cable 模組供應鏈結構。
透過與 UALink、OCP、CXL 聯盟的合作,它已逐步嵌入主流 AI 伺服器生態。
市場趨勢
AI Infrastructure 2.0 將成為未來三年的產業主軸。
「Rack = Compute Unit」的概念將推動新一波 AI SuperRack 標準化浪潮。



留言