0
| 本文作者: 胡敏 | 2026-05-25 13:27 |
當(dāng)?shù)貢r(shí)間5月21日,以“數(shù)據(jù)覺醒,存力躍遷”為主題的2026華為創(chuàng)新數(shù)據(jù)基礎(chǔ)設(shè)施論壇在巴黎舉行。會(huì)上,華為正式發(fā)布華為AIDC 數(shù)據(jù)基礎(chǔ)設(shè)施全棧方案,覆蓋數(shù)據(jù)湖、知識(shí)與記憶平臺(tái)、模型工程與資源調(diào)度、智能體框架、數(shù)據(jù)韌性平臺(tái)五大核心層級(jí),旨在助力企業(yè)加速推進(jìn) AI 數(shù)據(jù)中心建設(shè)、實(shí)現(xiàn) AI 規(guī)?;涞亍?/p>
華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁袁遠(yuǎn)將此次方案發(fā)布置于一個(gè)清晰的時(shí)代判斷之下:"當(dāng)下,AI 正深刻改變企業(yè)運(yùn)營模式。Agent 加速普及,成為新型數(shù)字生產(chǎn)力主體,逐步成長為企業(yè)的常態(tài)化'數(shù)字員工';同時(shí),AI 應(yīng)用持續(xù)深化,企業(yè) Token 消耗量迎來爆發(fā)式增長。"
他引用的數(shù)字印證了這一判斷:目前全球活躍智能體超過 3000 萬,預(yù)計(jì) 5 年內(nèi)將達(dá)到 22 億;每分鐘 Token 處理量已從去年的 60 億增至今年的 150 億。"Token 將像空氣和水一樣,成為我們生活的基礎(chǔ)設(shè)施。"
在此背景下,袁遠(yuǎn)指出,企業(yè)要加速 AI 落地,需推動(dòng)現(xiàn)有 IT 架構(gòu)向 AI DC 數(shù)據(jù)基礎(chǔ)設(shè)施快速演進(jìn),圍繞數(shù)據(jù)湖、知識(shí)與記憶平臺(tái)、算力、模型、Agent 框架與數(shù)據(jù)韌性等核心方向開展系統(tǒng)性規(guī)劃與建設(shè)。
據(jù)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))了解,在數(shù)據(jù)湖層,華為主推OceanStor Pacific 全閃分布式存儲(chǔ),以 11 PB/2U 的業(yè)界領(lǐng)先高容量密度實(shí)現(xiàn)最優(yōu) TCO,用于海量數(shù)據(jù)的存儲(chǔ)與匯聚。
配合硬件的是華為DME Omni-Dataverse 統(tǒng)一數(shù)據(jù)空間,支持多模態(tài)、跨站點(diǎn)數(shù)據(jù)實(shí)時(shí)入湖與全局可視可管,同時(shí)具備千億千維向量數(shù)據(jù)秒級(jí)檢索能力,實(shí)現(xiàn)高質(zhì)量數(shù)據(jù)的匯聚與供給。
袁遠(yuǎn)以某自動(dòng)駕駛企業(yè)為例說明了這一能力的現(xiàn)實(shí)意義,該企業(yè)需要管理來自雷達(dá)、傳感器和環(huán)境數(shù)據(jù)超過 1000 PB 的訓(xùn)練數(shù)據(jù),并在極端駕駛場景(如雨天紅燈、奔跑的行人)中快速召回特定條件下的海量圖像。"數(shù)據(jù)質(zhì)量決定模型質(zhì)量,在千億文件中找到正確的數(shù)據(jù),是訓(xùn)練成功的關(guān)鍵。"
平臺(tái)層是華為此次方案的核心,針對(duì)不同客戶規(guī)模提供兩套差異化產(chǎn)品。
面向超大規(guī)模推理集群,華為推出業(yè)界首個(gè)支持異構(gòu)算力的上下文記憶存儲(chǔ) CMS(Context Memory Storage)。CMS 支持 KV 語義直通或采用專用 DPU 進(jìn)行語義卸載,可擴(kuò)展為 PB 級(jí)共享 KV Cache 池,將推理首 Token 時(shí)延(TTFT)降低90%,顯著提升大規(guī)模推理集群的響應(yīng)效率。
面向企業(yè) AI 推理場景,華為首創(chuàng)"3+1" AI 數(shù)據(jù)平臺(tái),將三類能力整合為一體:
知識(shí)庫:檢索精度超過 95%,作為模型運(yùn)行的前置知識(shí)底座;
KV Cache 加速:解決多輪推理中的冗余計(jì)算問題,大幅節(jié)約推理成本與時(shí)間;
持續(xù)進(jìn)化的記憶庫:讓智能體積累經(jīng)驗(yàn)、越用越聰明。
三者由UCM 技術(shù)統(tǒng)一調(diào)度與管理,整體可提升推理精準(zhǔn)性30%。
袁遠(yuǎn)以一家金融機(jī)構(gòu)的 AI 編碼項(xiàng)目為例加以佐證:該項(xiàng)目部分任務(wù)需要多達(dá) 200 輪推理迭代,若每輪都將全量數(shù)據(jù)重新送入 GPU,既耗時(shí)又昂貴。KV Cache 的引入正是解決這一問題的關(guān)鍵。
在模型工程層,華為ModelEngine提供模型開箱即用與模型網(wǎng)關(guān)能力,支持零代碼適配新模型、一鍵部署,大幅降低模型上線門檻。
資源調(diào)度方面,ModelEngine 結(jié)合算力資源細(xì)粒度切分與智能調(diào)度,最大可實(shí)現(xiàn)XPU 卡 1:10 切分,即一張 GPU 卡同時(shí)承載多個(gè)模型任務(wù),實(shí)現(xiàn)"一卡多用",顯著提升資源利用率、降低硬件成本。
袁遠(yuǎn)以某大型醫(yī)院的通用 AI 平臺(tái)項(xiàng)目為例——該醫(yī)院同時(shí)部署超過 30 個(gè)模型,覆蓋檢測系統(tǒng)、臨床實(shí)踐和科研任務(wù),白天需要面向患者的實(shí)時(shí)推理,夜間切換為科研訓(xùn)練,GPU 調(diào)度壓力極大。ModelEngine 的彈性調(diào)度能力正是針對(duì)此類場景設(shè)計(jì)。
在技術(shù)棧頂層,華為ModelEngine Nexent 智能體平臺(tái)以降低開發(fā)門檻為核心設(shè)計(jì)目標(biāo):支持通過自然語言交互方式直接生成 Agent,無需專業(yè)編碼能力,使 Agent 上線周期縮短80%;同時(shí)支持對(duì) Skill、提示詞、記憶的自動(dòng)優(yōu)化,助力 Agent 持續(xù)演進(jìn)、越用越聰明。
袁遠(yuǎn)援引中國某頂級(jí)銀行的案例作為注腳:該行計(jì)劃用智能體替代全部人工客服,目標(biāo)是在一個(gè)月內(nèi)上線 120 個(gè)智能體,同時(shí)保證智能體在金融合規(guī)邊界內(nèi)持續(xù)自我進(jìn)化。Nexent 提供的正是從開發(fā)到部署再到演化的全流程支撐。
"如果你是醫(yī)生、金融從業(yè)者或教師,通過這套圖形化工具,你就可以自己開發(fā)智能體,"袁遠(yuǎn)說。
安全是華為此次方案的橫切關(guān)注點(diǎn)。袁遠(yuǎn)將企業(yè) AI 落地面臨的安全威脅歸納為四類:智能體濫用(誤刪文件、篡改規(guī)則等不可預(yù)期操作)、模型投毒(惡意數(shù)據(jù)污染訓(xùn)練過程)、數(shù)據(jù)篡改(修改關(guān)鍵任務(wù)的推理結(jié)果)、勒索軟件入侵(破壞數(shù)據(jù)湖完整性)。
華為的應(yīng)對(duì)方案是構(gòu)建防濫用、防投毒、防篡改、防勒索的端到端數(shù)據(jù)保護(hù)體系,針對(duì) Agent、模型、平臺(tái)與基礎(chǔ)設(shè)施等不同維度的潛在風(fēng)險(xiǎn),逐層部署差異化防護(hù)技術(shù)。"安全必須從一開始就嵌入每一層,而不是事后打補(bǔ)丁,"袁遠(yuǎn)說。
"AI 的下半程在于數(shù)據(jù),"袁遠(yuǎn)在演講結(jié)尾表達(dá)了華為的長期判斷,"AI 為 IT 產(chǎn)業(yè)帶來了無限機(jī)遇。華為數(shù)據(jù)存儲(chǔ)將堅(jiān)持技術(shù)創(chuàng)新,持續(xù)沉淀 AI 行業(yè)化落地經(jīng)驗(yàn),和全產(chǎn)業(yè)共同努力,幫助客戶加速邁向智能時(shí)代。"
在他看來,算力、模型、智能體這三個(gè) AI 發(fā)展章節(jié)已經(jīng)先后上演,而真正決定企業(yè) AI 競爭力高下的下一章,屬于數(shù)據(jù)。雷峰網(wǎng)將持續(xù)關(guān)注華為 AI 基礎(chǔ)設(shè)施領(lǐng)域的最新進(jìn)展。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。