所有部落格

AI 資料中心正將美國的電網推向崩潰邊緣

2026 年 4 月 17 日


隨著 AI 應用層面快速擴張,正加速推廣全球資料中心建設。然而,在這股熱潮背後隱藏著日益嚴重的擔憂:電力嚴重短缺,原因是供應難以跟上飆升的市場需求。這個問題在美國格外明顯。

儘管擁有充足的發電能力,美國電力產業仍面臨俗稱「併網排隊」的結構性問題。監管審核、電網連線限制,導致新的發電設施無法在需要時,將電力輸送到有需要的地方。Hitachi Group 旗下的公司最近解決以上瓶頸,他們為西南電力池的某個專案提供諮詢服務,SPP 是區域輸電組織,負責管理美國部分地區的電網、批發電力市場。

為何電網正在崩解

近年來,美國電價漲幅超過整體通貨膨脹指數。2020 年至 2024 年間,美國住宅曲的電價上漲大約 25%。主要驅動因素是老化的基礎設施升級成本,還有由 AI 熱潮推動的資料中心需求激增。

負責資料基礎設施開發的 Hitachi Vantara 公司 Shawn Monroe 現身說明這項挑戰的規模:「過去 100 年來,美國電力需求以每年 1% 至 3% 的溫和速度成長。但預測資料顯示,2025 年可成長 33% 至 35%,2026 年將可成長將近 40%。這表示基礎設施的工作負載在短短三年內可增加 300%,對於設計的使用壽命超過 50 年的基礎設施來說,速度實在太快。」


Hitachi Vantara 能源 AI 首席策略師Shawn Monroe


對於像是 SPP 這類區域輸電組織 (RTO) 來說,這種激增造成的打擊特別沉重。RTO 會管理大規模輸電網,審查來自發電廠、資料中心的併網互連請求。如今,他們在擴大基礎設施規模的同時,也面臨到提高效率等龐大壓力。

電網基礎設施正在業界造成延遲問題

SPP 是美國聯邦能源管理委員會 (FERC) 核准通過的復原時間目標之一。SPP 管理橫跨 37 州的龐大電網,堪稱美國第二大復原時間目標。

Monroe 解釋說道:「復原時間目標負責評估來自發電開發商的併網互連請求。」他繼續表示:「當開發商提議在某一定地興建新的發電機組時,復原時間目標必須模擬電力將如何流經電網,再找出可能出現壓力,或是資料擁塞的地方。」

如果發現漏洞弱點,開發商必須贊助必要的升級,但識別以上問題,提供詳細分析報告,則是復原時間目標的責任。

在 SPP,評估新發電專案的過程,調查整體電網,撰寫分析報告,平均費時 27.5 個月。對於大型專案而言,加上建設、調試和併網互連,代表在開始營運之前,可能還需要花上五年以上的時間。重點是,電網併網互連需要進行廣泛研究、模擬和複雜的工程分析。這段過程如有出現延誤,則會造成一種「擱置狀態」,亦即發電資源早已準備就緒,卻無法輸出電力。另外,新的資料中心可持續連上電網,增加市場需求。

據 SPP 估計,如果併網互連審核持續延後,備用容量率可能會從目前的 24% 驟降至 2029 年的 5%,情況相當危險。為了因應這類緊迫挑戰,Hitachi 集團建立一支新團隊,由六間子公司組成,可從上游開始規劃,連同 AI 基礎設施一併處理,解決各層面的挑戰。

團隊的努力超乎預期。SPP 最初的目標是想將分析時間縮短至 80%,但實際表現卻更出乎意料的良好。以前需要將近三週的流程,可以被縮短到不到一小時就能搞定。

使用端到端解決方案來解決問題

為何選擇 Hitachi,而非採用傳統公營事業供應商,或是 AI 專家來解決 SPP 的問題?Bo Yang 負責帶領 Hitachi 美國區的研發團隊,他點出三大原因:端到端的方法、整合 IT 和 OT(營運技術),以及深入參與整個業務流程。


Hitachi 美國區研發部門能源解決方案實驗室副總裁 Bo Yang


她表示:「重點不是改良單一軟硬體,而是消除整體分析過程中可能遇到的瓶頸。」她繼續說道:「許多 AI 供應商只會仰賴歷史統計數字。但電網這種關鍵任務系統會持續變化。當面臨未知情況時,這類模型就會失去精準度,在實際營運中,就無法獲得信賴。」

Hitachi 更進一步指出,利用設計思考重新設計營運流程,比照數十年 OT 專業知識,開發出實體 AI,確保現實電網環境中的安全性,兼顧精準度。

實體 AI 在能源電網中扮演的角色

Lumada 創新中心資深負責人 Yoshimitsu Kaji 指出,雖然生成式 AI 佔據時下的頭條新聞,但這類模型常因產生所謂的「幻覺」也就是會產出「似是而非的答案」而備受批評。

Kaji 表示:「比如像是電網這類社會基礎設施領域,即使是錯誤也無法接受。」他繼續問道:「在某個根本不容許出錯的領域,又是如何確保 AI 具備信度?」

Yang 回答道:「典型資料導向 AI 可從歷史資料中學習,只會比照統計數字進行推論。相較之下,實體 AI 會直接將科學定律,例如:數學和物理學嵌入演算法本身。」

例如:在電機工程中,克希荷夫電路定律的概念定義出電流、電壓的行為模式。實體 AI 可將這類物理原理作為硬性約束,納入演算法中。克希荷夫電路定律並不像大型語言模型那樣只仰賴機率解釋,而是結合事實導向的物理計算、統計推論,創造混合方法。

Yang 表示:「純粹的資料導向 AI 在面對不熟悉或未見過的情境時,可能會捏造出統計學上似是而非的答案。然而,物理導向 AI 會受到不變物理定律約束。這類定律就像一條牽繩,以防 AI 出現失控行為,還可確保 AI 產出物理上的有效解決方案,即使是遇到歷史資料裡未曾出現過的情況也是如此。」

透過引導實體導向 AI,SPP 能夠提高電網互連研究的精準度和速度,這類研究必須透過先進模擬來評估眾多模式。這一成果代表 Yang 的領導力,還有在 Hitachi 累積的專業知識結晶。

Hitachi iQ:透過專有基礎架構,加速 AI

在生成式 AI 的世界中,大規模預訓練模型被用於執行推論。模型功能越強大,記憶體佔用量就越大。理想情況下,整個模型應駐留在高速 DRAM 中,但實際上,規模往往需要仰賴大容量的儲存空間,難以避免會拖累效能。

實體導向 AI 對基礎架構的要求更為嚴苛。需要極複雜的運算,才能快速存取海量模擬資料。這正是 Hitachi iQ 得以發揮作用的地方。

在傳統系統中,資料讀寫會經由 CPU、作業系統核心,明顯增加開銷,可能遇到效能瓶頸。然而,Hitachi iQ 會略過作業系統核心,再將資料直接從儲存裝置傳輸到 GPU,消除 CPU 的等待時間。

Monroe 熱心地說明技術優勢:「傳統通訊協定在本質上是單向,受限於 CPU 的限制,傳輸量只有大約 1.6 Gbps。Hitachi iQ 匯集多個超高速 800 Gbps 連線,能將資料直接串流至 GPU。結合 Hitachi 在大規模資料湖技術方面的長期專業知識,該架構的設計主要圍繞著以下原則:絕不讓 GPU 擱置。」

透過端對端優化軟體,才能符合 GPU 特性,SPP 已實現明顯提高效能,通常會使用的資源不到原先所需的一半,處理速度更快。展望未來,SPP 將可推動的 77 億美元的傳輸電網強化計畫,早已超越原定分析時間縮短 80% 的目標,若少了這個合作框架,就不可能實現以上目標。

了解 Hitachi iQ 如何協助貴組織大規模提供極高效能和彈性,無論資料位於何處,都能統一存取。