隨著人工智慧 (AI) 重塑各行各業,卻也在悄悄革新直導 IT 核心的大本營:資料中心。 AI 工作負載呈現爆炸性成長,大幅提高用電量,也為冷卻系統帶來不少挑戰,要求我們徹底反思資料儲存空間和移動資料的方式。
遇到這種全新態勢下,快閃記憶體儲存空間便可脫穎而出,提供加速發展所需的效能、效率和可擴展性。然而,對許多組織來說,尤其是在成本或建檔需求佔據主導地位等領域,磁碟儲存空間依然很重要。這並非突然從某種技術切換成另一種技術,而是要找到合適的組合,即可支援每個組織發展各自獨一無二的歷程。
目前問題真正的癥結點是:您應該什麼時候才開始發展出針對 AI 儲存空間的策略?還有應如何規劃最佳前進路線?
這裡有些想法,可以協助您開始使用。
AI 能源浪潮:基礎設施的轉捩點
AI 工作負載本質上就很耗電。隨著模型規模、複雜度不斷成長,能源需求也隨之增加。國際能源總署預測,等到了 2030 年,全球資料中心 (DC) 的用電量可能會增加一倍以上,AI 將成為主要驅動力。某些預測顯示資料中心每年的耗電量可能超過 1000 太瓦小時,遠遠超過日本目前一整年的用電量。
這不只是單純的容量問題,更可能引發永續發展危機。由於功率密度比起典型的資料中心應用程式用電量,還要高出 5 到 10 倍以上,每台機架用電量超過 100 千瓦,GPU 的功率更高達 1500 瓦特,傳統基礎設施正面臨極限挑戰。
有些事勢必得改變,也沒時間可以浪費。
儲存空間:負責處理 AI/資料中心能源危機的默默貢獻者
雖然運算通常備受矚目,但儲存空間也是資料中心耗能的重要因素,常常被人忽略。傳統硬碟 (HDD) 仍被廣泛使用。不過以當今 AI 的功耗標準來看,效率並不高。
相較之下,全快閃 NVMe 固態硬碟 (SSD) 倒是能提供極具吸引力的替代方案,原因如下:
- 閒置功耗:HDD會消耗 5-10 瓦特,NVMe SSD則只會消耗 0.2-0.8 瓦特。
- 效能功耗比:SSD 每瓦特可提供高達 50 倍的 IOPS。
- 密度:快閃記憶體可以在更小的空間內,容納更大的容量,藉此降低能源和冷卻需求。
某項測試結果顯示,有一架固態硬碟 (SSD) 的容量和效能,足以取代 23 架傳統硬碟 (HDD),同時提供 54 倍的讀取頻寬,功耗只佔 HDD 的一小部分。這不只是提升效能,更是永續發展的必然要求。
冷卻創新:從自選款到基本款應有盡有
AI 基礎架構的發熱量,恰好加速對液體冷卻的需求。與傳統風冷系統相比,液體冷卻系統如今可提供更加卓越的機架密度、散熱效能。由於能將設施功耗降低將近 20%左右,還可將資料中心的總功耗降低 10% 以上,這些創新已不再是實驗性質。隨著效率提升,液冷資料中心如今儼然成為支援超過 500W 晶片的關鍵,同時也能確保資料中心有符合功耗、碳預算。
信度和儲存空間的總體擁有成本
對於資料基礎架構而言,能源效率只是總體擁有成本 (TCO) 方程式的一部分。信度在衡量 TCO 方面,也能發揮關鍵作用:
- 傳統硬碟的年化故障率大約是 1.4%,故障模式也可預測。
- NVMe 固態硬碟會更頻繁地出現「緩慢故障」行為,卻很少發生災難性故障。
- 營運影響:快閃記憶體的信度更高,維修費用更低,不只能減少停機時間,更能降低管理大規模儲存空間相關的能源、勞動力成本。
底線:信度不只能影響直接更換成本,還可能影響到監控、維修和效能一致等營運相關費用,這些費用都可能會成為降低能源消耗 SSD 的 TCO 因素。
讓環境保護、社會責任、公司治理三者 (ESG) 和 AI 就緒目標協調一致
轉型改用全快閃儲存空間,符合一系列更廣泛的企業策略重點:
- 永續發展:降低用電量、減少佔地面積、電子垃圾減量。
- AI 效能:NVMe 的低延遲、高效能非常適合用於 AI 管道。
- 編列能源預算:減少的儲存空間能源消耗,就可以重新分配給最需要的運算領域。
因此,營運層收益也有助於實現公司的企業環境、永續發展和公司治理三大目標。這算是取得雙贏的局面。
是時候該開始淘汰磁碟導向的儲存空間了嗎?
根據特定技術發展歷程,每種組織都會有各自獨特需求,包括那些可能仍需要仰賴某種磁碟儲存空間形式的組織。雖然 HDD 也許依然具備冷儲存空間優勢,符合每 TB 成本,但效率低下,卻讓支援 AI 驅動環境的合理性變得沒有以往高。
快閃記憶體具備每瓦特 5,000% 的效能優勢,加上實體/空間、營運優勢,為加速轉型提供強而有力的理由,尤其是那些傾向於讓整個企業採用 AI 的企業。
下一步:創新與洞察力機會
當我們考慮何時、如何開始因應這一連串的轉變時,還有幾個問題仍等待我們去探索:
- 投資報酬率的時間:當考慮到節省能源、冷卻和空間時,想轉換成快閃記憶體,還需要多久時間才能獲得回報?
- AI 的特定儲存空間模式:我們如何針對日趨動態、資料密集、延遲敏感度高的 AI 工作負載,將儲存空間架構最佳化?
- 生命週期影響力:從誕生到毀滅,快閃記憶體與 HDD 的總體環境成本是多少,才有包括製造、營運和處理費用?
- 混合策略:HDD 在哪些方面仍具意義,我們該如何使用快閃記憶體,從中取得平衡,以便大幅提高效能和成本?
- 節能軟體:智慧儲存空間管理和 AI導向的編排能否進一步減少能源消耗、碳足跡呢?
當您和團隊正在思考這些問題時,請務必牢記,AI 不只改變資料中心的功能,也改變未來的發展方向。轉型改用全快閃儲存空間這件事,不單只是效能升級,更是邁向轉型,使用更為永續、更具彈性、支援更多的 AI 就緒基礎架構策略。
隨著工作負載的不斷成長,還有環境壓力不斷加大,未來資料中心勢必得更加精簡、更具智慧、更加環保。擁抱快閃記憶體算是變革的關鍵一步。這不單只是為求速度快,也是為了管理方便。
這段通往數位生態系統的旅程,在此效能、永續發展彼此不再相互矛盾,反而更是密不可分。
從來就沒有兩次歷程完全一模一樣
正如我們開篇所述,每名客戶都處於 AI 歷程的不同階段——有些客戶已經在構建,但有些客戶才剛開始規劃未來。但無論您身在何處,事情很明白:讓資料中心現代化,建立強大的快閃記憶體資料基礎,這才是釋放 AI 潛力的關鍵。
正因如此,擁有全局眼光的合作夥伴非常重要。在 Hitachi Vantara,我們深知成功的 AI 不只存在於儲存空間,更在於合理協調運算、網路、資料管理和卓越營運。我們在傳統、新一代資料中心環境,都擁有豐富經驗,能和客戶並肩合作,共同設計、最佳化,同時擴大基礎架構規模,能夠帶來持久價值。
無論您的 AI 歷程進展到哪一步,不管您關注的是效能、效率、永續發展,還是成本,我們都竭誠協助您建立一種能夠加速實現 AI 夢想的環境,而不是讓您受限。讓我們攜手共創 AI 大未來,就從資料、企業所需的基礎開始吧。
繼續閱讀:
Atsushi Ishikawa
Atsushi Ishikawa is Chief Technology Officer for Network Storage at Hitachi Vantara.
Jason Hardy
Jason Hardy 是日立數據系統人工智慧首席技術長