華為發(fā)布AIDC數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案，覆蓋數(shù)據(jù)湖至智能體框架五大層級(jí)

本文作者：胡敏

2026-05-25 13:27

導(dǎo)語：在巴黎IDI峰會(huì)上，華為正式發(fā)布AI DC數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案。

當(dāng)?shù)貢r(shí)間5月21日，以“數(shù)據(jù)覺醒，存力躍遷”為主題的2026華為創(chuàng)新數(shù)據(jù)基礎(chǔ)設(shè)施論壇在巴黎舉行。會(huì)上，華為正式發(fā)布華為AIDC 數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案，覆蓋數(shù)據(jù)湖、知識(shí)與記憶平臺(tái)、模型工程與資源調(diào)度、智能體框架、數(shù)據(jù)韌性平臺(tái)五大核心層級(jí)，旨在助力企業(yè)加速推進(jìn) AI 數(shù)據(jù)中心建設(shè)、實(shí)現(xiàn) AI 規(guī)?；涞亍?/p>

華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁袁遠(yuǎn)將此次方案發(fā)布置于一個(gè)清晰的時(shí)代判斷之下："當(dāng)下，AI 正深刻改變企業(yè)運(yùn)營模式。Agent 加速普及，成為新型數(shù)字生產(chǎn)力主體，逐步成長為企業(yè)的常態(tài)化'數(shù)字員工'；同時(shí)，AI 應(yīng)用持續(xù)深化，企業(yè) Token 消耗量迎來爆發(fā)式增長。"

他引用的數(shù)字印證了這一判斷：目前全球活躍智能體超過 3000 萬，預(yù)計(jì) 5 年內(nèi)將達(dá)到 22 億；每分鐘 Token 處理量已從去年的 60 億增至今年的 150 億。"Token 將像空氣和水一樣，成為我們生活的基礎(chǔ)設(shè)施。"

在此背景下，袁遠(yuǎn)指出，企業(yè)要加速 AI 落地，需推動(dòng)現(xiàn)有 IT 架構(gòu)向 AI DC 數(shù)據(jù)基礎(chǔ)設(shè)施快速演進(jìn)，圍繞數(shù)據(jù)湖、知識(shí)與記憶平臺(tái)、算力、模型、Agent 框架與數(shù)據(jù)韌性等核心方向開展系統(tǒng)性規(guī)劃與建設(shè)。

AI 數(shù)據(jù)湖：OceanStor Pacific + 千億級(jí)語義檢索

據(jù)雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))了解，在數(shù)據(jù)湖層，華為主推OceanStor Pacific 全閃分布式存儲(chǔ)，以 11 PB/2U 的業(yè)界領(lǐng)先高容量密度實(shí)現(xiàn)最優(yōu) TCO，用于海量數(shù)據(jù)的存儲(chǔ)與匯聚。

配合硬件的是華為DME Omni-Dataverse 統(tǒng)一數(shù)據(jù)空間，支持多模態(tài)、跨站點(diǎn)數(shù)據(jù)實(shí)時(shí)入湖與全局可視可管，同時(shí)具備千億千維向量數(shù)據(jù)秒級(jí)檢索能力，實(shí)現(xiàn)高質(zhì)量數(shù)據(jù)的匯聚與供給。

袁遠(yuǎn)以某自動(dòng)駕駛企業(yè)為例說明了這一能力的現(xiàn)實(shí)意義，該企業(yè)需要管理來自雷達(dá)、傳感器和環(huán)境數(shù)據(jù)超過 1000 PB 的訓(xùn)練數(shù)據(jù)，并在極端駕駛場景（如雨天紅燈、奔跑的行人）中快速召回特定條件下的海量圖像。"數(shù)據(jù)質(zhì)量決定模型質(zhì)量，在千億文件中找到正確的數(shù)據(jù)，是訓(xùn)練成功的關(guān)鍵。"

知識(shí)與記憶平臺(tái)：CMS 與"3+1"AI 數(shù)據(jù)平臺(tái)雙線并進(jìn)

平臺(tái)層是華為此次方案的核心，針對(duì)不同客戶規(guī)模提供兩套差異化產(chǎn)品。

面向超大規(guī)模推理集群，華為推出業(yè)界首個(gè)支持異構(gòu)算力的上下文記憶存儲(chǔ) CMS（Context Memory Storage）。CMS 支持 KV 語義直通或采用專用 DPU 進(jìn)行語義卸載，可擴(kuò)展為 PB 級(jí)共享 KV Cache 池，將推理首 Token 時(shí)延（TTFT）降低90%，顯著提升大規(guī)模推理集群的響應(yīng)效率。

面向企業(yè) AI 推理場景，華為首創(chuàng)"3+1" AI 數(shù)據(jù)平臺(tái)，將三類能力整合為一體：

知識(shí)庫：檢索精度超過 95%，作為模型運(yùn)行的前置知識(shí)底座；
KV Cache 加速：解決多輪推理中的冗余計(jì)算問題，大幅節(jié)約推理成本與時(shí)間；
持續(xù)進(jìn)化的記憶庫：讓智能體積累經(jīng)驗(yàn)、越用越聰明。

三者由UCM 技術(shù)統(tǒng)一調(diào)度與管理，整體可提升推理精準(zhǔn)性30%。

袁遠(yuǎn)以一家金融機(jī)構(gòu)的 AI 編碼項(xiàng)目為例加以佐證：該項(xiàng)目部分任務(wù)需要多達(dá) 200 輪推理迭代，若每輪都將全量數(shù)據(jù)重新送入 GPU，既耗時(shí)又昂貴。KV Cache 的引入正是解決這一問題的關(guān)鍵。

模型工程與資源調(diào)度：ModelEngine 實(shí)現(xiàn)"一卡多用"

在模型工程層，華為ModelEngine提供模型開箱即用與模型網(wǎng)關(guān)能力，支持零代碼適配新模型、一鍵部署，大幅降低模型上線門檻。

資源調(diào)度方面，ModelEngine 結(jié)合算力資源細(xì)粒度切分與智能調(diào)度，最大可實(shí)現(xiàn)XPU 卡 1:10 切分，即一張 GPU 卡同時(shí)承載多個(gè)模型任務(wù)，實(shí)現(xiàn)"一卡多用"，顯著提升資源利用率、降低硬件成本。

袁遠(yuǎn)以某大型醫(yī)院的通用 AI 平臺(tái)項(xiàng)目為例——該醫(yī)院同時(shí)部署超過 30 個(gè)模型，覆蓋檢測系統(tǒng)、臨床實(shí)踐和科研任務(wù)，白天需要面向患者的實(shí)時(shí)推理，夜間切換為科研訓(xùn)練，GPU 調(diào)度壓力極大。ModelEngine 的彈性調(diào)度能力正是針對(duì)此類場景設(shè)計(jì)。

智能體框架：Nexent 將上線周期縮短 80%

在技術(shù)棧頂層，華為ModelEngine Nexent 智能體平臺(tái)以降低開發(fā)門檻為核心設(shè)計(jì)目標(biāo)：支持通過自然語言交互方式直接生成 Agent，無需專業(yè)編碼能力，使 Agent 上線周期縮短80%；同時(shí)支持對(duì) Skill、提示詞、記憶的自動(dòng)優(yōu)化，助力 Agent 持續(xù)演進(jìn)、越用越聰明。

袁遠(yuǎn)援引中國某頂級(jí)銀行的案例作為注腳：該行計(jì)劃用智能體替代全部人工客服，目標(biāo)是在一個(gè)月內(nèi)上線 120 個(gè)智能體，同時(shí)保證智能體在金融合規(guī)邊界內(nèi)持續(xù)自我進(jìn)化。Nexent 提供的正是從開發(fā)到部署再到演化的全流程支撐。

"如果你是醫(yī)生、金融從業(yè)者或教師，通過這套圖形化工具，你就可以自己開發(fā)智能體，"袁遠(yuǎn)說。

數(shù)據(jù)韌性平臺(tái)：端到端四層防護(hù)

安全是華為此次方案的橫切關(guān)注點(diǎn)。袁遠(yuǎn)將企業(yè) AI 落地面臨的安全威脅歸納為四類：智能體濫用（誤刪文件、篡改規(guī)則等不可預(yù)期操作）、模型投毒（惡意數(shù)據(jù)污染訓(xùn)練過程）、數(shù)據(jù)篡改（修改關(guān)鍵任務(wù)的推理結(jié)果）、勒索軟件入侵（破壞數(shù)據(jù)湖完整性）。

華為的應(yīng)對(duì)方案是構(gòu)建防濫用、防投毒、防篡改、防勒索的端到端數(shù)據(jù)保護(hù)體系，針對(duì) Agent、模型、平臺(tái)與基礎(chǔ)設(shè)施等不同維度的潛在風(fēng)險(xiǎn)，逐層部署差異化防護(hù)技術(shù)。"安全必須從一開始就嵌入每一層，而不是事后打補(bǔ)丁，"袁遠(yuǎn)說。

"AI 的下半程在于數(shù)據(jù)，"袁遠(yuǎn)在演講結(jié)尾表達(dá)了華為的長期判斷，"AI 為 IT 產(chǎn)業(yè)帶來了無限機(jī)遇。華為數(shù)據(jù)存儲(chǔ)將堅(jiān)持技術(shù)創(chuàng)新，持續(xù)沉淀 AI 行業(yè)化落地經(jīng)驗(yàn)，和全產(chǎn)業(yè)共同努力，幫助客戶加速邁向智能時(shí)代。"

在他看來，算力、模型、智能體這三個(gè) AI 發(fā)展章節(jié)已經(jīng)先后上演，而真正決定企業(yè) AI 競爭力高下的下一章，屬于數(shù)據(jù)。雷峰網(wǎng)將持續(xù)關(guān)注華為 AI 基礎(chǔ)設(shè)施領(lǐng)域的最新進(jìn)展。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章