ECOC 2025 技術焦點:Terahop 談 AI 資料中心的光學解決方案
- drshawnchang
- 10月1日
- 讀畢需時 3 分鐘
前言
AI 的快速發展正在推動資料中心從傳統網路邁向「AI 工廠」的新型態。這不僅需要龐大的 GPU/XPU 算力,也需要多層次的網路來串接—from Scale-Up(機內 GPU 互連)、Scale-Out(跨節點擴展)、到 Scale-Cross(跨資料中心園區)。
在 ECOC 2025 上,Terahop 介紹了其對 AI 資料中心光互連的看法,並強調可靠性、功耗效率、以及開放生態系將是產業發展的關鍵。
內容
1. AI 資料中心的多層網路需求
Scale-Up:需將數百顆 GPU 緊密互連成單一計算單元,延伸至 >200 GPU 的規模。
Scale-Out:形成數萬級 GPU 的叢集,甚至跨多棟機房。
Front-End:面向客戶的傳統資料中心網路。
Scale-Cross:跨資料中心園區連結,距離涵蓋 2 km、10 km 甚至 80 km,需要 ZR 類模組。
👉 結論:AI 資料中心不是單一網路,而是多層次光學解決方案的組合。
2. 800G → 1.6T → 3.2T 的過渡
800G:過去兩年已大規模出貨,多數基於矽光子實現。
1.6T:目前處於標準化過程,業界已開始部署多種型態:
AOC (≤10m)
DR4/DR8 (100m~500m)
FR4 (2 km 級)
ZR (80 km 級)
3.2T / 3.5T:預計 2027~2028 年左右浮現,業界逐漸收斂至 400G/lane × 8 channels 的設計,但仍在主機端/光學端封裝方式上存在爭論。
3. 線性 vs. 全重定時光模組
Fully Retimed (FRO):成熟、可靠,但功耗較高。
Linear Optics (LRO / RTLR):OIF 新標準化名稱,結合 Retimed TX 與 Linear RX。可顯著降低功耗。
LPO:挑戰大,但仍在研究中。
👉 產業共識:短期內會同時存在多種實作形式,以應對不同應用場景。
4. 矽光子與新技術的角色
矽光子已成主流:800G 與 1.6T 的量產證明了其可靠性。
優勢:可提供大規模出貨數據,累積的現場可靠性資料成為未來世代的重要基礎。
新材料探索:400G/lane 時代可能需要混合技術(如 DML、混合積體方案),但 SiPh 仍是主要選項。
5. Scale-Up 的新機會:光取代銅
現況:Google 等公司仍依賴銅纜,每個機櫃多達 5000 條電纜,複雜且低效。
光學機會:光能提供更高帶寬、更低延遲,並讓 GPU 數量擴展超過 200 顆。
關鍵挑戰:需兼顧高可靠性、低功耗(可接受 GPU 功耗的 5~10% 占比)、以及合理成本。
6. 可插拔 vs. CPO 的折衝
可插拔模組:維護容易、開放性高,是客戶偏好的第一選擇。
CPO:需在 ASIC 設計階段即做決策,風險高,更新速度跟不上每兩年一代的升級節奏。
中間解法:Near-Packaged Optics (NPO) 或 共封裝銅互連 (Co-Packaged Copper),兼顧低損耗與開放生態。
7. 開放生態系的重要性
垂直整合問題:NVIDIA 等大廠推動的封閉式方案限制了產業參與。
Terahop 觀點:應推動 開放式插槽 (Open Socket) 與 標準化連接介面,允許多種技術共存(DML、SiPh、慢速寬頻方案皆可接入)。
願景:透過 OIF 等國際組織,建立共享生態,讓更多廠商能參與 AI 光學解決方案。
總結
Terahop 在 ECOC 2025 的演講提出以下觀點:
AI 資料中心的網路需求多層次化:從 AOC 到 ZR,從 800G 到 3.2T,需全面性的光學解決方案。
可靠性是第一優先:昂貴的 GPU 投資迫使客戶要求模組有驗證過的現場可靠性。
矽光子已站穩基礎:累積的出貨量與現場數據確立了其主流地位,但未來需混合新技術。
可插拔仍是首選,但需尋找過渡解法:CPO 過於封閉,NPO 與 Co-Packaged Copper 可能成為務實替代方案。
開放生態是產業長遠發展關鍵:唯有多方參與,才能支持 AI 時代的高速演進。
這場演講凸顯出:AI 的需求正推動光互連進入全新時代,而開放、可靠、靈活的解決方案才是真正能支撐產業的方向。


















留言