0
| 本文作者: 徐咪 | 2026-05-21 09:56 |
5月19日,聯(lián)想在北京舉辦“天禧AI一體多端全場景超能之夜”,正式發(fā)布專為智能體打造的AI原生個人家庭邊緣設(shè)備——聯(lián)想AI主機P7。該設(shè)備搭載后摩智能專為大模型在端邊側(cè)推理打造的AI芯片M50,憑借存算一體架構(gòu),在僅手掌大小的機身內(nèi)流暢運行最高1220億參數(shù)本地大模型。
后摩智能M50已進入量產(chǎn)階段,P7的問世,代表著M50高能效端邊側(cè)推理能力正引領(lǐng)AI創(chuàng)新硬件進入可高效運行千億參數(shù)大模型的新時代。
M50撐起千億參數(shù)大模型端側(cè)推理
聯(lián)想AI主機P7的端側(cè)算力核心——后摩智能M50,讓這臺僅重300g的設(shè)備,具備190TOPS本地AI算力,最高支持1220億參數(shù)大模型本地部署。無網(wǎng)環(huán)境下,本地自主推理速度可達50Tokens/s;配合最高80GB內(nèi)存和128K上下文窗口,復(fù)雜任務(wù)亦可流暢處理;整機最大功耗僅30W,普通移動電源即可驅(qū)動,運行噪音低于35dBA。
隨著Agent時代到來,云端算力成本高企、Tokens 消耗激增、網(wǎng)絡(luò)延遲受限等問題日益凸顯。M50提供的可媲美云端的端側(cè)算力,極致高效的性能、靈活方便的部署形態(tài),正成為AI硬件廠商打造高算力創(chuàng)新終端的首選。
一機雙模,口袋里的免費Token工廠
基于后摩智能M50提供的大算力基座,聯(lián)想AI主機P7提供“一機雙?!毙滦螒B(tài)。智能體模式下,P7在本地運行天禧Claw,復(fù)雜任務(wù)最大化在本地執(zhí)行;大模型模式下,P7提供API Key,開放接入各類AI應(yīng)用和智能體,秒變本地免費Token工廠,使用戶擺脫云端付費焦慮。
此外,聯(lián)想AI主機P7可7×24小時連續(xù)執(zhí)行任務(wù),輕小便攜,用戶可隨身攜帶作為口袋AI工作站使用,在無網(wǎng)情況下P7持續(xù)提供穩(wěn)定的端邊側(cè)推理服務(wù)。數(shù)據(jù)隱私性得到有效保護,數(shù)據(jù)不出端,在本地存儲和處理。
聯(lián)想AI主機P7將于7月1日正式開啟眾籌。 P7的量產(chǎn)上市,標(biāo)志著后摩智能 M50成功打破算力壁壘,真正實現(xiàn)千億級參數(shù)大模型從云端下沉、走進消費級 AI 創(chuàng)新終端。憑借卓越的能效比與端邊側(cè)推理能力,M50讓AI硬件以更低功耗承載更高密度算力,大幅降低端邊側(cè) AI 規(guī)?;占伴T檻。未來,后摩智能將持續(xù)以極致能效推動AI端邊側(cè)硬件創(chuàng)新,用最小能耗釋放最大智能。