【導讀】隨著人工智能技術的飛速發展,GPU算力的指數級增長正對底層基礎設施提出前所未有的挑戰。Solidigm深刻洞察到,單純依靠計算能力的提升已不足以支撐未來的AI工作負載,存儲系統的效率與架構革新成為了決定系統整體性能的關鍵。面對這一轉型,Solidigm總結了當前重塑AI數據存儲格局的三大核心趨勢:存儲發展必須與GPU算力同步演進以打破性能瓶頸,專用AI SSD正從被動存儲向主動計算參與者轉變,以及液冷技術的興起將為高密度服務器環境帶來物理形態的根本性變革。這些趨勢共同指向一個更加均衡、高效且智能的AI基礎設施新范式。
趨勢一:存儲的發展必須與GPU算力齊頭并進
當GPU變得日益強勁,存儲的效率需要相應提升,在更高的性能要求與更低的功耗之間取得平衡。Solidigm工程經理Hardeep Singh表示:“功耗至關重要。GPU功耗的攀升,要求存儲必須變得更高效,用較低的功耗維持高性能。”這給服務器內部和整個集群帶來了很多的存儲挑戰。
在服務器內部,GPU算力的持續增長讓存儲的性能瓶頸愈發凸顯。原因有以下幾點:首先,現代加速器消耗數據的速度超過了傳統NVMe SSD的數據供給速度。在存儲路徑無法滿足GPU數據需求的環節,將不可避免地帶來系統性能的降低。
Solidigm的AI專家們表示,這一挑戰在集群層面會進一步加劇:為數千個GPU供給數據,需要大規模的SSD集群。這些集群需要能夠提供極高的并行性,在讀取密集型的AI工作負載下實現出色的磨損均衡,并且在QoS不會下降的前提下保持性能的穩定。
遺憾的是,存儲并不是唯一的瓶頸。范圍、規模以及與主機系統的交互都將受到類似影響。確保內部和外部網絡能高效地將數據從存儲端傳輸到計算資源將非常重要。
克服這些障礙的方法,在于存儲解決方案的規模與擴展能力。我們應該不只關注單個驅動器的速度,還應該關注能夠駕馭強大GPU需求的解決方案級能力。如前所述,相較于計算能力,存儲效率才是系統性能的決定性因素。
談及最近發布的NVIDIA推理上下文記憶存儲平臺(ICMSP),Solidigm AI與生態系統營銷總監Ace Stryker剖析道:“多年來,模型訓練數據的激增吸引了大量的目光,但真正的爆發其實發生在由RAG數據與KV緩存(模型用于記憶用戶交互的上下文)等趨勢驅動的AI推理端。”他補充說,NVIDIA的發布印證了這一點。Solidigm憑借其領先的產品、穩固的伙伴關系和深厚的技術積淀,已準備好引領這場變革。
Ace Stryker 表示:“顯而易見,通過GPU內存來管理所有內容是天方夜譚,而高性能SSD是正確的解決方案。”
趨勢二:專用AI SSD演進,以滿足AI存儲需求
為支撐AI所需的海量吞吐,SSD從被動的存儲設備演變為了主動的計算參與者。SSD架構正在經歷著深刻變革,包括:
深度并行:重新設計控制器,為極高的隨機讀取IOPS服務,同時降低尾延遲峰值,避免AI訓練停滯。
精簡堆棧:進一步精簡PCIe和NVMe堆棧,在數據路徑中降低每微秒的延遲。
更智能的固件:先進的遙測和數據放置算法能夠預取數據,并將其精確地部署在GPU需要的地方。
存儲架構的演進還體現在其利用SSD不同特性的方式上。Solidigm領導力敘事與技術布道總監Scott Shadley指出,SSD一貫的低延遲性能,能夠應對持續增長的數據訪問需求,而將數據從HDD遷移至SSD,則為實時AI應用提供了數據可用性保障。隨著SSD逐漸轉變為AI專用驅動器,SSD的角色將不再局限于存儲,而更像一種高帶寬的內存擴展。
趨勢三:液冷存儲的興起
我們預見,2026年最重大的物理形態變革,將是向無風扇的液冷服務器環境的過渡。正如Solidigm AI與領導力營銷高級總監Roger Corell所說,對于功率密度日益增高的環境而言,高效的散熱管理至關重要;而在散熱效率上,液冷比風冷要高出一個數量級。Solidigm團隊與NVIDIA率先推出了采用單面冷板技術的液冷eSSD,這一合作是一個很好的范例。
這一物理形態轉變的背后,有兩大驅動力:其一,當GPU/CPU采用液冷后,傳統風扇便失去了存在的必要;其二,隨著存儲功耗與性能的同步上升,傳統風冷已力不從心。
液冷的采用,消除了服務器設計對于風冷的依賴。這使得SSD能在維持同等尺寸的前提下,釋放出更高的持續性能。Solidigm AI市場賦能與合作高級總監Avi Shetty表示:“借助遠超風冷的散熱效率,液冷技術讓存儲能夠從容應對下一代AI系統在散熱與密度上的嚴苛要求。”
借助全液冷的解決方案,我們得以擺脫傳統風扇散熱的束縛,從而更好地優化系統設計。這一改變賦予了設計更高的自由度,催生了密度更高的服務器形態,并加速了SSD從U.2等傳統規格向EDSFF等新形態的過渡。


SSD:AI的核心賦能者
展望2026年和未來,曾經算力為王的AI時代開始邁向一個更加均衡、整體的基礎設施新范式。衡量一個系統性能的,不僅僅是GPU每秒萬億次的浮點運算,更是數據供給的效率。
Solidigm關注的重點從未改變:我們專注于那些足以重塑AI數據存儲及未來格局的開拓性理念與創新。我們期待與您攜手,共同邁向一個存儲扮演AI工作流程中主動、智能參與者角色的未來。
總結
AI時代將從“算力為王”邁向計算與存儲協同發展的整體基礎設施新紀元。衡量系統性能的標準不再僅僅是GPU的浮點運算能力,更在于數據供給的效率與智能化水平。Solidigm將繼續致力于通過開拓性的理念與創新,推動存儲角色從被動的數據倉庫轉變為AI工作流程中主動、智能的參與者。



