2025年8月,全球權(quán)威AI性能基準(zhǔn)評(píng)測(cè)組織MLCommons®公布最新一輪MLPerf® Storage v2.0基準(zhǔn)測(cè)試結(jié)果。紫光股份旗下新華三集團(tuán)發(fā)布的新一代高性能分布式融合存儲(chǔ)Polaris X20000以單節(jié)點(diǎn)158.92 GB/s、集群總帶寬突破476.752GB/s的優(yōu)異成績,登頂高性能RoCE AI存儲(chǔ)解決方案榜首。
這一成績不僅彰顯了新華三在高性能存儲(chǔ)領(lǐng)域的持續(xù)創(chuàng)新能力,更標(biāo)志著Polaris X20000已躋身全球頂尖行列,為大模型訓(xùn)練、AI推理與高性能計(jì)算等數(shù)據(jù)密集型場(chǎng)景提供堅(jiān)實(shí)的數(shù)據(jù)底座。
MLPerf® Storage v2.0
AI存儲(chǔ)性能的全球標(biāo)桿
在AI大模型訓(xùn)練中,算力不足往往并不是GPU的問題,而是存儲(chǔ)系統(tǒng)供給不夠。當(dāng)數(shù)百甚至上千張GPU同時(shí)等待數(shù)據(jù)時(shí),即使最強(qiáng)大的加速器也會(huì)因“無米下鍋”而空轉(zhuǎn),造成訓(xùn)練效率大幅下降。
MLPerf® Storage v2.0正是面向這一核心痛點(diǎn)設(shè)立的全球權(quán)威基準(zhǔn)測(cè)試。它通過模擬真實(shí)AI訓(xùn)練負(fù)載,從根本上考察存儲(chǔ)對(duì)智算系統(tǒng)的支撐能力:
● 聚焦GPU利用率:在MLPerf® Storage v2.0基準(zhǔn)測(cè)試中,3D-UNet與ResNet50模型需在保持GPU利用率90%以上的條件下進(jìn)行帶寬測(cè)評(píng),這一標(biāo)準(zhǔn)被視為檢驗(yàn)存儲(chǔ)能否真正“喂飽”算力的核心指標(biāo)。
● 覆蓋真實(shí)應(yīng)用場(chǎng)景:包含對(duì)帶寬要求極高的3D-UNet醫(yī)學(xué)影像分割訓(xùn)練,以及大模型訓(xùn)練中必不可少的Checkpoint斷點(diǎn)保存與恢復(fù),全面檢驗(yàn)存儲(chǔ)在AI全流程中的作用。
● 行業(yè)廣泛認(rèn)可:本輪v2.0測(cè)試共有26家全球主流廠商提交200余項(xiàng)數(shù)據(jù),成為AI存儲(chǔ)選型與性能對(duì)比的事實(shí)標(biāo)準(zhǔn)。
正如MLPerf存儲(chǔ)工作組聯(lián)合主席Curtis Anderson所言:“存儲(chǔ)性能已經(jīng)從幕后配角,轉(zhuǎn)變?yōu)闆Q定訓(xùn)練能否高效推進(jìn)的核心要素。”新華三Polaris X20000在本次測(cè)試中登頂,不僅刷新了性能數(shù)字,更證明其在真實(shí)AI生產(chǎn)環(huán)境中,能夠?yàn)槌笠?guī)模智算集群提供穩(wěn)定而高效的數(shù)據(jù)底座。
3D-UNet模型
苛刻負(fù)載下的實(shí)測(cè)登頂
在本次測(cè)試的3D-UNet醫(yī)學(xué)影像分割模型場(chǎng)景中,存儲(chǔ)系統(tǒng)需應(yīng)對(duì)持續(xù)高吞吐、低時(shí)延高并發(fā)訪問以及長周期一致性三大挑戰(zhàn)。
測(cè)試結(jié)果顯示:
● 單節(jié)點(diǎn)性能:Polaris X20000單節(jié)點(diǎn)持續(xù)帶寬158.92 GB/s;
● 集群性能:總帶寬突破476.752GB/s,顯著領(lǐng)先同類產(chǎn)品;
● GPU規(guī)模:可同時(shí)支持320個(gè)GPU;并實(shí)現(xiàn)GPU利用率大于90%。
新華三Polaris X20000系列專為AI智算場(chǎng)景設(shè)計(jì),采用全新自研存儲(chǔ)引擎,面向AI/HPC場(chǎng)景下的海量數(shù)據(jù)處理需求提供極致性能,滿足AI大模型訓(xùn)練中海量小文件高并發(fā)和百TB級(jí)帶寬需求;并將塊、文件、對(duì)象與HDFS協(xié)議集成于統(tǒng)一存儲(chǔ)平臺(tái),從數(shù)據(jù)采集、模型訓(xùn)練到分發(fā)全流程實(shí)現(xiàn)數(shù)據(jù)零遷移。同時(shí),系統(tǒng)大幅提升可靠性,ms級(jí)故障上報(bào)與秒級(jí)切換確保訓(xùn)練任務(wù)不中斷,計(jì)劃內(nèi)/外升級(jí)擴(kuò)容對(duì)上層應(yīng)用無感,為企業(yè)提供穩(wěn)定、高效的存儲(chǔ)支持。
在本次測(cè)試中,帶寬與并發(fā)性能的雙突破,充分印證了Polaris X20000在高性能存儲(chǔ)與AI訓(xùn)練真實(shí)負(fù)載下,可以有效避免算力空轉(zhuǎn),顯著縮短模型訓(xùn)練時(shí)間,有效保護(hù)用戶算力投資。
RoCE:AI存儲(chǔ)網(wǎng)絡(luò)的主流演進(jìn)方向
隨著大模型規(guī)模和GPU數(shù)量的持續(xù)攀升,存儲(chǔ)網(wǎng)絡(luò)已成為影響AI集群效率的關(guān)鍵因素。RoCE(RDMA over Converged Ethernet)憑借高性能、低延遲以及更優(yōu)的TCO,正在迅速成為智算中心的主流網(wǎng)絡(luò)選擇。相比傳統(tǒng)高成本的InfiniBand網(wǎng)絡(luò),RoCE在性能接近的同時(shí)具備更高的性價(jià)比和更友好的運(yùn)維體驗(yàn),這也使得其在實(shí)際用戶部署中更具吸引力。
新華三選擇基于高性能RoCE AI存儲(chǔ)方案,正是立足于這一趨勢(shì)和客戶的實(shí)際落地需求。通過RDMA技術(shù)實(shí)現(xiàn)的零拷貝與低時(shí)延傳輸,有效降低了CPU占用率,將更多算力釋放給模型訓(xùn)練;無損以太特性的引入,則消除了網(wǎng)絡(luò)擁塞與丟包風(fēng)險(xiǎn),為大規(guī)模訓(xùn)練的穩(wěn)定性提供保障。依托這一方案,Polaris X20000不僅展現(xiàn)了性能上的領(lǐng)先優(yōu)勢(shì),更為用戶在實(shí)際AI項(xiàng)目中構(gòu)建高效、可靠、可擴(kuò)展的智算基礎(chǔ)設(shè)施提供了可復(fù)制的參考路徑。
“內(nèi)生智能成就智慧”
持續(xù)引領(lǐng)AI基礎(chǔ)設(shè)施演進(jìn)
新華三始終秉持“內(nèi)生智能成就智慧”的發(fā)展理念,在產(chǎn)品架構(gòu)設(shè)計(jì)、性能調(diào)優(yōu)和智能運(yùn)維方面持續(xù)創(chuàng)新。Polaris X20000在MLPerf® Storage v2.0權(quán)威評(píng)測(cè)中登頂,不僅是一次性能突破,更是新華三體系化能力與行業(yè)地位的集中體現(xiàn)。未來,新華三將繼續(xù)深耕高性能存儲(chǔ)領(lǐng)域,推動(dòng)AI基礎(chǔ)設(shè)施向更高性能、更高可靠、更智能化方向演進(jìn),攜手生態(tài)伙伴助力全球AI產(chǎn)業(yè)加速發(fā)展。
(來源:新華三)