top of page

OCP Global Summit 2025_Microsoft_Infrastructure for a New Era: Powering AI at Frontier Scale

前言

在 OCP Global Summit 2025 上,Microsoft 分享了如何透過 Azure 基礎設施與 OCP 標準,推動 AI 運算進入前所未有的規模。他們強調,AI 的發展已經進入「中場階段」,不再只是展示潛力的 Lap One,而是需要 紀律、效率與責任 的長期擴展 Infrastructure for a New Era Po…。


內容

Azure 擴展與 Fairwater AI 資料中心

Microsoft 表示,過去 12 個月 Azure 容量新增了 2 GW,相當於三年前整體 Azure 的總量。核心代表作是 Fairwater AI 資料中心

  • 315 英畝、120 萬平方英尺規模

  • 數十萬顆 GB200 GPU 透過高效能網路連接

  • Exabyte 等級的儲存與數百萬個運算核心

    單一資料中心效能可達傳統超級電腦的 10 倍,並且未來會有多個此類設施互相串聯,形成跨區域 AI 超級集群 Infrastructure for a New Era Po…。


成本與效率的突破

Microsoft 特別強調 AI 運算必須「實用化」。透過全棧優化,他們在兩年內讓 GPT-4 推論成本降低 93%。這意味著 AI 不只是強大,更能以更低成本被廣泛部署,類似當年印刷術徹底改變知識傳播 Infrastructure for a New Era Po…。


液冷與電力創新

AI 帶來的功耗密度推動資料中心全面導入液冷:

  • Microsoft 建立 零水浪費的循環液冷系統

  • 推出第二代 熱交換單元,冷卻能力翻倍,能無縫整合進現有空冷資料中心

  • 在電力架構上,推動 高壓直流分配、固態變壓器與解耦式電力架構

  • Mount Diablo 架構:支援 ±400V/800V,單機架功耗突破 1MW,同時減少轉換損耗Infrastructure for a New Era Po…


網路需求的轉變

Microsoft 指出,AI 工作負載和傳統雲端不同:

  • AI 訓練需要 90% 的頻寬利用率、極低尾延遲,且鏈路失效會拖慢整個工作

  • 他們正在推動 Ethernet 在 Scale-up 網路的優化,並與 UEC 等聯盟合作

  • 目標是建立可擴展的 AI 專屬網路,從單一資料中心到跨區域 AI WANInfrastructure for a New Era Po…


系統可靠性與運維標準化

AI 系統需要新的可靠性思維。Microsoft 推出:

  • AI 工作級別的韌性(Job-level Resilience),確保節點故障能在小時內恢復

  • 韌體標準化:CPU/GPU/加速器管理框架,支援無中斷更新

  • 先進遙測與異常預測:利用 ML 與規則引擎提升全域集群的可靠度Infrastructure for a New Era Po…


永續與安全承諾

Microsoft 宣布:

  • 將在全球 24 國部署 34 GW 再生能源,並達成 碳負排、水資源正向 的承諾

  • 在 OCP 貢獻 Embodied Carbon Disclosure 框架,幫助供應鏈透明化

  • 在安全上,透過 Caliptra 2.1、Adamsbridge 2.0 與 OCP Lock,確保 AI 基礎設施從矽晶片到儲存都具備可信根與抗量子加密能力Infrastructure for a New Era Po…


總結

Microsoft 在 OCP 2025 的核心訊息是:AI 基礎設施的規模化必須同時兼顧效率、永續與安全。從 Fairwater AI 資料中心到 Mount Diablo 電力架構,再到 OCP 標準化貢獻,Microsoft 正將 Azure 打造成 全球 AI 超級電腦網路,並以責任感確保擴展可持續。


延伸觀點

  1. 技術影響

    • Microsoft 的液冷與固態變壓器策略,會推動 電力電子(SiC/GaN)、冷卻模組與 AI 光互連 的快速發展。

  2. 供應鏈觀察

    • 34 GW 再生能源承諾,代表資料中心供應鏈將與 能源產業 深度綁定,對電網、儲能、冷卻供應商都是新機會。

    • OCP 的 Embodied Carbon Disclosure 框架,可能成為未來 雲端供應鏈採購標準,影響 ODM、OEM 廠商。

  3. 市場趨勢

    • Microsoft 強調「責任擴展」,與 Oracle 的 Gigawatt 級資料中心 觀點呼應,但更突顯 安全與永續性的差異化。

    • 隨著 NVIDIA、AMD、Broadcom 聚焦在 GPU 與網路,Microsoft 以 系統 + 能源 + 安全 切入,定位成 AI 基礎設施的整合者

最新文章

查看全部
OCP Global Summit 2025_Oracle_Building Zettascale AI Clusters with OCI: Scaling Together with Open Ecosystem for the Next Gen AI Cluster

前言 Oracle 在 OCP Global Summit 2025 上帶來了關於  如何以 OCI(Oracle Cloud Infrastructure)建構 Zettascale 級別 AI 超級集群  的演講。隨著 AI 基礎設施的快速擴展,Oracle 強調  速度、規模與開放標準  是下一代資料中心的三大核心關鍵,並透過 OCP 社群推動標準化,來降低供應鏈與部署風險 Building

 
 
 
OCP Global Summit 2025_Supermicro_Building an AI Data Center of the Future Requires a Combination of Standardization and Innovation

前言 在 OCP Global Summit 2025 上,Supermicro 分享了他們對未來 AI 資料中心的觀點,強調要兼顧  標準化與創新 。隨著 AI 訓練與推論需求快速成長,單一伺服器的效能提升已不足以支撐產業需求,必須透過  集群化、模組化與液冷設計  來實現大規模部署。Supermicro 特別強調,開放社群 OCP 在推動標準與技術落地的角色至關重要 Building an A

 
 
 

留言


  • Facebook
  • Instagram

©2021 by DRFLYOUT. Proudly created with Wix.com

bottom of page