top of page

OCP Global Summit 2025_Terahop_Optics for Scale-Up

前言

在 OCP Global Summit 2025 上,Terahop 聚焦於一個核心主題:「Scale-Up Optics」——當光學連結從機架間走進 GPU 集群內部。

演講中強調,AI 訓練與推論集群的規模與頻寬需求正推動光學應用從「Scale-Out」(跨機架)進化到「Scale-Up」(機架內),而未來更將延伸到「Scale-Across」(跨資料中心)。這是光通訊產業在 AI 時代的下一個增長引擎。


內容

1. Optics 的新邊界:從 Scale-Out 到 Scale-Up

Terahop 指出,傳統上光模組大多用於 Scale-Out(交換機間的長距離連線),但隨著 GPU 集群的規模從單一機架 64–72 顆 GPU,擴展至跨機櫃 1000–2000 顆 GPU,AI 系統的頻寬需求暴增十倍以上。

而在這個距離僅數公尺的範圍內,光互連取代電訊號 成為關鍵——

因為:

  • 頻寬需求大幅上升(10x bandwidth growth)

  • 空間受限,密度提升造成熱與布線壓力

  • 可靠性要求極高,維修成本昂貴

因此,Terahop 認為 Scale-Up Optics 將是下一個光學應用的主戰場。


2. 核心需求:頻寬、密度、可靠性與成本

在這個新場景下,幾個設計原則變得關鍵:

  • 頻寬與密度:在有限空間內達到更高 I/O 數量,需要低功耗、高整合的 SiPh(矽光子)方案。

  • 可靠性:光模組直接接近 GPU/NIC,維修難度高,MTBF(平均無故障時間)必須遠高於傳統光模組

  • 成本與功耗比:光連線成本必須與 GPU 投資相當,不得成為整體系統的負擔。

Terahop 以實際運行數據說明,截至今年,他們的 SiPh 平台已累積超過 400 億 device hours,平均故障率低於 0.1%,顯示矽光子技術已達商用成熟水準。


3. 矽光子與高密度光模組的演進

Terahop 展示了最新的 1.6T 光模組設計,採用 5nm DSP + SiPh 平台,並已開始量產。

未來兩年內將過渡至 200G/lane 架構,並導入:

  • LPO(Linear-Drive Pluggable Optics) 與 LRO(Linear Receiver Optics),降低 DSP 功耗與成本

  • RTLR(Retimed Transmitter Linear Receiver) 架構,平衡功率與通道穩定度

    整體功耗有望降至 <10 pJ/bit,若全面採用 LPO,則可進一步降至 6 pJ/bit 以下。

在成本上,Terahop 預期每 bit 成本將從目前約 $0.5/Gbps 降至 $0.1/Gbps

這項趨勢反映了整個光通訊產業透過量產化與封裝整合所帶來的指數型成本下降。


4. 高容量可插拔(Pluggable)仍是短期主力

雖然長期方向是 Near-Packaged Optics (NPO) 與 Co-Packaged Optics (CPO),但 Terahop 強調高密度可插拔仍是主力產品。

他們展示的路線圖包括:

  • 1.6T → 3.2T → 12.8T pluggable optics

  • 支援 PAM4/PAM6/PAM8,並在 OIF 公開測試中通過互通性驗證

  • 可支援從「Fast & Narrow」到「Slow & Wide」的多樣傳輸模式

這意味著 短期仍會延續 pluggable 模組的演進,而非全面切換至 CPO。


5. 向 Near-Packaged 與 Co-Packaged Optics 演進

Terahop 認為,Optics 的最終形態將是從 pluggable 漸進式過渡到:

  1. NPO (Near-Packaged Optics):光模組與 ASIC 相鄰但非共封裝,透過短距離電連接降低通道損耗。

  2. CPO (Co-Packaged Optics):光引擎與交換 ASIC 同基板整合,形成真正的光電協同架構。

但他們也明確指出,目前的 CPO 市場仍屬於「垂直整合試驗階段」,由少數系統商主導(如 Broadcom、Meta、Marvell)。Terahop 呼籲產業推動「開放式 CPO 生態」,讓多家供應商能參與共規、共測、共製。


6. 推動 Open Ecosystem 的呼聲

Terahop 強調,開放生態是未來的核心關鍵

  • 需要開放的 socket 與 footprint 標準,讓不同廠商的 NPO/CPO 模組可互換。

  • 目前已有 Advanced Photonics Coalition (APC) 正在推動「Open CPO Standards」,共有 45 家企業參與,並與 OIF、IEEE、OCP 社群協同。

  • 開放架構能讓不同雷射技術(CW laser、EML、VCSEL、Micro-LED)在同一平台共存,讓市場而非封閉供應鏈決定技術走向。


總結

Terahop 在 OCP 2025 的演講明確指出:

「Scale-Up Optics 是下一個萬億級市場,CPO 不是終點,而是開放光學架構的起點。」

光互連將從機架間(Scale-Out)進入 GPU 集群(Scale-Up),最終橫跨多資料中心(Scale-Across)。

矽光子技術的成熟、成本曲線下行、與開放生態的建立,將讓光連結正式取代電連結,成為 AI 時代的資料中心基礎。


延伸觀點

  1. 技術影響

    • Terahop 的觀點代表產業從「系統整合」轉向「光域計算」的新階段,SiPh 將不再只是傳輸媒介,而是 Compute Fabric 的一部分

    • RTLR 與 LPO 的導入,意味著 DSP 正從中心移往邊緣,降低延遲與能耗。

  2. 供應鏈觀察

    • Terahop 所提的開放 CPO 生態,將直接挑戰 Broadcom、Marvell 等垂直整合模式。

    • 若 Open CPO 由 APC 成功推動,將重新定義光模組 ODM / Foundry / 封裝廠的合作模式。

  3. 市場趨勢

    • 短期(2025–2026):Pluggable 與 NPO 共存,主打 1.6T–3.2T 模組。

    • 中期(2027–2028):CPO 開始量產並形成開放標準。

    • 長期(2030+):Scale-Up 與 Scale-Across 結合,資料中心將進入「光域網路化」時代。

最新文章

查看全部
OCP Global Summit 2025_Credo_Wired for Success: Enhancing AI Cluster Reliability with Copper Cables

前言 在 OCP Global Summit 2025 上, Credo  帶來了一個看似傳統、卻在 AI 時代重新被重視的主題—— 銅纜(Copper)在 AI 資料中心的角色回歸 。 當業界普遍關注光互連(Optical Interconnect)與 CPO 技術時,Credo 以實際部署數據與可靠性分析指出: 在 GPU 密集叢集的近距離連接中,銅纜不僅依然可行,甚至是提高可靠度的關鍵選項。

 
 
 
OCP Global Summit 2025_Intel_Scaling AI at the Speed of Openness: From Silicon to Systems

前言 在這場 OCP Global Summit 2025 中,Intel 聚焦於一個關鍵主題:「如何以開放、模組化與異質化的基礎架構推動 AI 基礎設施的擴展」。面對生成式 AI、推理與 Agentic AI 帶來的計算與網路挑戰,Intel 提出了從  矽(silicon)到系統(systems)  的完整願景。這場分享不僅回顧了過去 OCP 社群推動資料中心標準化的經驗,也強調 Intel

 
 
 

留言


  • Facebook
  • Instagram

©2021 by DRFLYOUT. Proudly created with Wix.com

bottom of page