寧暢AI算力?;鹆θ_,用全局智算鑿出通往AGI的快車道

智東西(公眾號:zhidxcom)
作者 | 三北
編輯 | 漠影

“AI+”時代,大模型正如雨后春筍般涌現,以重構千行百業之勢向通用人工智能(AGI)全速沖鋒。

“每隔一天在中國就有一個AI大模型出現,我們開玩笑說‘實現了大模型的日拋’?!睂帟矯EO秦曉寧在3月29日北京舉辦的寧暢“全局智算”戰略發布會上說。

寧暢AI算力?;鹆θ_,用全局智算鑿出通往AGI的快車道

▲寧暢CEO秦曉寧

AI大模型日新月異,客戶涌現出對于AI支撐能力體系愈發復雜的需求。不管是萬卡時代的算效“彩票”還是深入行業的精度“盲盒”,以及高效調用的服務“瓶頸”,算力產業如何解決這些問題,如何滿足大模型客戶不同的復雜需求,如何建立起一套全面的AI支撐能力體系,都是當下亟需解決的問題。

基于這樣的背景,在大模型遍地開花之春,寧暢于3月39日發布了“全局智算”戰略,在業內率先開啟大模型時代智能算力系統變革的沖鋒。

同時,寧暢還推出包括“AI算力棧”在內的一系列戰略性新品與系統解決方案,以助大模型產業解決大模型產業落地的全周期問題。

一、大模型遍地開花,用全局智算栽培“AI+”碩果

我國大模型已經遍地開花。根據國家數據局最新統計,中國10億參數規模以上的大模型數量已超100個,行業大模型已經在賦能各個領域。

大模型狂歡背后,是大模型行業和企業的需求不斷升級,推動整個AI支撐能力的加速迭代。

深扎AI算力領域多年,秦曉寧在過去近一年里有了新發現。她觀察到,大模型發展到現在,客戶的需求大致呈現了兩個階段的變化:

第一階段:“百模大戰”時期,流行這樣一句話:不管大模型發展得如何,賣鏟子的供應商肯定不會虧。大模型是科技巨頭之間的參數極限的競賽,算力提供商就像賣鏟子一樣,只需要提供更快更強的硬件產品,不用太關注大模型客戶如何去挖掘“金礦”,

第二階段:也就是進入2024年以來,隨著外部環境變化,大模型從參數競賽走向了商業化、產業化的落地階段。供應商不僅要提供算力硬件,更多的是整個支撐能力體系的升級,就像“木桶原理”一樣,各類能力都不能有短板。

秦曉寧認為,客戶需要在算力、算法、數據三個維度獲得更強的支撐,并在AI的硬件層、集群層、中臺層、內容層、服務層都獲得全方位多維度的能力。

為此,寧暢宣布推出“全局智算”戰略,助客戶解決復雜、系統性的大模型落地問題。

全局智算,顧名思義,就是以系統、全面性來對抗需求的復雜性,以全面AI支撐能力覆蓋大模型發展的全生命周期。如下圖所示,全局智算主要包括大層面。

寧暢AI算力?;鹆θ_,用全局智算鑿出通往AGI的快車道

▲寧暢全局智算能力圖

最底層是硬件資源層,這是被大家最廣泛所熟知的,以傳統的通用服務器、GPU、整機柜、存儲、網絡等多種形態的硬件產品為主。

第二層是集群設計層,這不是將海量硬件進行簡單的連接堆疊,而是通過分析整個業務運行的特征和系統的量化需求,提供從微架構、網絡、存儲到AI模型特征等一系列的方案化設計。

第三層是算子優化層,為了降本增效寧暢提供了整體的AI算子優化能力,減少模型執行的時間,降低資源消耗,提高能效比,使得AI能夠在有效的資源上高效運行。

第四層是AI中臺層,目前寧暢已全面支持NVAIE的中臺系統,及自己的中臺NEX AIOM,這個系統可以提供基于AI算力系統深度整合的工作棧。

再往上,則是更具體的業務層場景層,寧暢也提供相應的解決方案及服務。

總的來看,寧暢提出的“全局智算”戰略,試圖通過全體系、全液冷、全服務、全場景、全行業、全階段這“六全”來為大模型提供全周期服務,從而培育出“AI+”產業化的碩果。

寧暢AI算力?;鹆θ_,用全局智算鑿出通往AGI的快車道

▲寧暢全局智算硬件產品“全家?!?/p>

二、硬軟服一體化,破解智能算力落地難題

過去一年,受益于“百模大戰”,我國算力規模加速擴容,為算力落地應用提供了一定基礎。

根據工信部發布數據,截至2023年10月我國算力規模超300EFLOPS,智能算力占比高達35%;同時,我們看到千P級智算中心的智算基建布局集中爆發,數億到10億元的GPU服務器采購及算力租賃訂單比比皆是,眾多算力概念股也被帶飛。

但與此同時,智能算力的落地應用問題依然嚴峻。如何讓千卡甚至萬卡算力從硬件,轉化為大模型企業的模型性能,甚至是“AI+”行業落地的成功?算力產業還有一段路要走。

對此,寧暢推出了“AI算力棧”,以底層硬件到頂層應用平臺的系統化方案,構建全棧AI環境,滿足大模型落地所需的計算、存儲、網絡、建設、管理、應用及液冷等需求。

寧暢CTO趙雷介紹,在硬件層上,寧暢“AI算力?!笨蓪崿F多種交付形態靈活組合。其中,寧暢B8000液冷整機柜服務器作為AI算力棧最具亮點的交付形態,采用電、液、網三路全盲插設計,部署周期相較傳統方式提升30倍。

寧暢AI算力?;鹆θ_,用全局智算鑿出通往AGI的快車道
▲寧暢CTO趙雷

在軟件層上,基于系統工程及算法模型,寧暢以AI算子全棧優化能力,為AI業務提供并行加速、性能分析、模型開發優化等服務支持,構建出從算力資源定制,到模型適配優化,再到高效部署落地的大模型算力服務閉環,幫助用戶極速推進AI應用開發及管理。

英特爾AI首席架構師吳震華強調:“第四代/第五代英特爾? 至強? 可擴展處理器的卓越性能,將為寧暢AI算力棧帶來更強助力?!?/p>

此外,在智算中心建設大潮下,寧暢“AI算力?!狈桨敢云淙?、靈活、深度的支撐能力,可為行業級/企業級智算中心的構建提供強有力的支持,確保智算中心的建設既符合當前業務所需,又具備前瞻性與適應性。

縱觀整個算力產業,我們看到包括“味精大王”在內的不少跨行玩家都涌入了智算產業,但兼具硬、軟、服實力的玩家并不多。

透過寧暢“AI算力?!?,應該可以明確的是,企業和行業為了避免重復建設和浪費,應該選擇沒有能力短板的專業AI算力提供服務商,搭建智能計算的新高地。

三、寧暢打造王牌AI算力棧,加速千行百業數智化

目前,國內首個“AI算力?!?/strong>——寧暢NEX AI?Lab(Nettrix AI Open Lab)已在桐鄉市成功落地并開放預約試用。

寧暢AI算力?;鹆θ_,用全局智算鑿出通往AGI的快車道
▲寧暢NEX AI?Lab

這一AI算力棧項目是一個包括128臺GPU服務器的千卡級別算力集群。該項目展現了應用場景優化、行業智算定制解決方案,通過免費提供軟、硬件服務,帶來大模型、數據科學、推薦系統等解決方案工作流的先進體驗。

同時,它可以給用戶提供免費的算力體驗,大家可以把自己的業務拿到上面運行,嘗試不同的業務組合、不同的網絡方案、不同的軟件和框架的調整,以便快速作出購買決策。

趙雷透露,這一AI算力棧最主力服務器采用X640 G50服務器,單臺具備956T的算力;同時支持20個節點的X680 G55液冷服務器,有效地驗證了液冷服務器在高帶寬情況下的使用情況。

在應用方面,這一AI算力棧已正式運行近三周。該算力棧已完成了大量的多元AI場景的實際應用,包括語言模型、OCR、翻譯、智能推薦等,都順利完成了初步測試。

寧暢自2019年創立以來,根據知名行研機構IDC報告,其在2021年就拿下來中國GPU及加速計算服務器市場年度銷售額第二的寶座?,F在,乘風新一波AI大模型浪潮,寧暢正通過千卡集群級的AI算力棧,布局更大的“全局智算”藍圖,從而助力千行百業的數智化轉型。

結語:智能計算升級,為大模型產業發展保駕護航

回顧2023年,在“百模大戰”狂潮之中,智能算力成為一門好生意。以寧暢為代表的算力供應商在厚積薄發的同時,也在大模型市場需求的推動下,探索智能算力系統的新迭代。

展望2024年,“AI+”時代的大模型產業化落地正在加速,誰在盛名之下其實難副,誰是真槍實劍披掛上陣?寧暢正用“全局智算”戰略及其AI算力棧方案給出一份自信的答卷,為大模型產業發展保駕護航。