top of page

OCP Global Summit 2025_Google_OCP Optical Circuit Switching Subproject Update

前言

在 OCP Global Summit 2025 上,Google 針對 OCP Optical Circuit Switching (OCS) 子專案帶來了最新進展。這項工作由 Google 工程師主導,旨在推動 OCS 的開放標準化,讓光路交換(Optical Circuit Switching)能成為 AI 資料中心與雲端網路基礎設施的新核心技術。OCS 的核心精神是「純光域(all-optical)、零轉換、協同開放」,希望以光取代傳統電交換的瓶頸,實現低延遲、高效率、可程式化的資料中心網路架構。

內容

1. 什麼是 OCS(Optical Circuit Switching)

OCS 本質上是一個「光纖交叉連接盒」,能在兩個埠之間建立純光路徑,沒有任何光電轉換。這意味著:

  • 協定無關(Protocol-agnostic):支援 Ethernet、InfiniBand、甚至自定義通訊協定。

  • 速率無關(Rate-agnostic):不需因鏈路速率升級而更換硬體。

  • 低延遲、低功耗:避免了 E/O/OE 轉換,沒有封包排隊或緩衝。

    OCS 可藉由多種方式實現,包括 機械式切換(robotic fiber switch)MEMS 鏡面反射,或 矽光子式光路導引(SiPh-based beam steering)

2. 為什麼資料中心需要 OCS

傳統 Ethernet 交換機雖然靈活,但功耗高、延遲固定,且每一次封包轉發都需經過 ASIC pipeline。

而 OCS 提供了:

  • 零中介延遲的直通連線(cut-through path)

  • 流量獨立性(不受封包型態影響)

  • 無緩衝安全性(不會遭到封包攔截或修改)

對於大型 AI 集群(例如 10,000+ GPU 的訓練網路)而言,這能顯著減少尾延遲、節省功耗,並簡化物理布線拓樸。

3. OCS 工作小組的目標與架構

Google 與 OCP 成立的 OCS Working Group,目標是建立開放的 OCS 生態系。主要有四個工作主軸:

  1. 硬體開放規格(Open Hardware Specs):定義通用的光切換架構與控制介面。

  2. 軟體與管理(Software Specs):標準化控制、管理、遙測、告警等 API。

  3. AI 資料中心應用(AI Cluster Optimization):發展使用案例與白皮書。

  4. 互通性(Interoperability):確保不同廠商的 OCS 能以統一介面協同運作。

目前軟體規格是最活躍的方向,工作組已開始與 Linux Foundation、SONiC、OpenConfig、IETF 等組織協作,打造可整合的開源軟體堆疊。

4. Google 的實作與介面設計

Google 同時是 OCS 的使用者與自製者

他們的策略是:

  • 以 SONiC 為核心平台,復用既有的 Ethernet switch 軟體基礎。

  • 將 OCS 管理介面擴展至 UMF(Unified Management Framework),支援三大開放 API:

    • GNMI:設定與遙測。

    • GNOI:運維與光路控制(如建立、刪除、替換連線)。

    • GNSI:安全與金鑰管理。

  • 為 OCS 加入 主動監控與健康檢測 功能,以追蹤光路連線狀態與錯誤回報。

5. 安全性與部署流程

Google 為 OCS 系統設計了嚴謹的 Secure Installation Protocol,從 DHCP、Boot Server、憑證註冊到 attestation 驗證,確保從出廠到部署的每一個環節都能防止供應鏈攻擊與中間人入侵。

6. 使用場景與應用層次

Google 的主要應用案例來自 Apollo 專案(可重構光交換架構)。OCS 主要部署在:

  • Scale-out 層(跨機架):取代 Spine Network。

  • Scale-up 層(機架內):動態連接 GPU / CPU 節點。

  • AI Cluster 拓樸重構:隨訓練階段調整拓樸,優化 GPU 帶寬利用率。

對 Google 而言,OCS 就像一個「可程式化的光學 patch panel」,能即時重新配置實體網路,而不必重新布線或中斷運作。

總結

Google 在這次 OCP 2025 的更新中,明確將 OCS 視為下一代資料中心的結構性基石。藉由將 SONiC 軟體堆疊擴展到光交換領域,結合 OCP 的開放規範,Google 希望讓光學拓樸的可編程化成為主流。未來的資料中心將不只是「軟體定義的網路(SDN)」,而是「光層可定義的網路(ODN, Optical Defined Network)」。

延伸觀點

  1. 技術影響

    • 這是光互連發展的重要轉折點。Google 將 OCS 的控制平面與 SONiC 合流,意味著 光網路正進入軟體定義時代。未來 AI Cluster 將不再是靜態布線,而是根據流量與任務即時重構。

    • SiPh(矽光子)與 MEMS 技術將成為 OCS 模組的關鍵基礎,這也讓 OCS 與矽光子產業鏈出現強烈共振。

  2. 供應鏈觀察

    • 隨著 Google 推動開放 API,第三方廠商(如 Lumentum、Calient、Cisco、Furukawa)有機會以相容規格進入 Hyperscale 市場。

    • 另一方面,Google 內部自製 OCS 表示 大型雲端商正走向自有光學設備,這將改變光交換供應鏈的權力分布。

  3. 市場趨勢

    • OCS 的採用標誌著 從電交換 → 光交換 → 光控制層整合 的轉變。

    • 這對未來 AI 專用資料中心(AI-DC) 的拓樸與布線設計影響深遠,也可能催生「光交換即服務(Optical Switching as a Service)」的新商業模式。

最新文章

查看全部
OCP Global Summit 2025_Marvell & Jabil_Next Generation Co-Packaged Optics System

前言 在 OCP Global Summit 2025 上,Marvell 與 Jabil 聯合展示了他們最新的  Co-Packaged Optics(CPO)系統設計 。這次的分享聚焦於系統整合,而非單純光學模組層面,展現從  電晶片、光學引擎、系統板設計、冷卻、製造到部署  的全棧協同。Marvell 強調:「CPO 已不再是 ‘if’,而是 ‘when’。」這意味著,隨著 AI 與高速運算

 
 
 
OCP Global Summit 2025_Astera Labs_Scaling AI with PCIe, Ethernet, and UALink Retimers

前言 在今年的 OCP Global Summit 中, Astera Labs  帶來的主題「 Scaling AI with PCIe, Ethernet, and UALink Retimers 」不僅是產品發表,更是一場關於  AI Infrastructure 2.0 架構演進的宣言 。 隨著 AI 模型規模爆炸式增長,Astera 強調: 「伺服器不再是運算單位,整個機架(Rack)才

 
 
 
OCP Global Summit 2025_Astera Labs_Trust at 64 GT/s: Security Considerations for PCIe 6 Switch Deployments

前言 在 AI 資料中心與高頻寬計算快速擴張的背景下, PCIe 6.0  已成為關鍵的互連主幹。而隨著速率提升至  64 GT/s 、通道數暴增,連接範圍從伺服器延伸到整個機架甚至多機架, 安全性問題  成為設計中不可忽視的挑戰。 在 OCP 2025, Astera Labs  的技術長 Abdeshavia 帶來的主題演講—— 「Trust at 64 GT/s」 ,針對 PCIe Gen6

 
 
 

留言


  • Facebook
  • Instagram

©2021 by DRFLYOUT. Proudly created with Wix.com

bottom of page