RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

本文作者：張夏寧

2025-12-22 17:52

導(dǎo)語：當(dāng)Transformer走到盡頭，面對的是參數(shù)和規(guī)模的極限，端側(cè)群體智能或許是AI發(fā)展的另一條出路。

12月12日，第八屆 GAIR 全球人工智能與機器人大會于深圳正式拉開帷幕。

本次大會為期兩天，由GAIR研究院與雷峰網(wǎng)(公眾號：雷峰網(wǎng))聯(lián)合主辦，高文院士任指導(dǎo)委員會主席，楊強院士與朱曉蕊教授任大會主席。

作為AI產(chǎn)學(xué)研投界標(biāo)桿盛會，GAIR自2016年創(chuàng)辦以來，始終堅守“傳承+創(chuàng)新”內(nèi)核，是AI學(xué)界思想接力的陣地、技術(shù)交流的平臺，更是中國AI四十年發(fā)展的精神家園。過去四年大模型驅(qū)動AI產(chǎn)業(yè)加速變革，歲末年初GAIR如約而至，以高質(zhì)量觀點碰撞，為行業(yè)與大眾呈現(xiàn)AI時代的前沿洞見。

本次峰會之上，RockAI CMO鄒佳思以“擺脫Transformer的束縛，讓智能重新定義硬件”為主題，為參會者們帶來了一場精彩紛呈的演講。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

鄒佳思通過提出一個生活場景的假設(shè)作為開場，描繪了一幅充分開發(fā)端側(cè)智能后的日常生活圖景。在設(shè)想中，家庭場景中智能設(shè)備的聯(lián)動無需云端參與。如回家后設(shè)備自動完成放音樂、加熱水、拉窗簾、定鬧鐘、點早餐等操作，這一系列動作，通過在終端設(shè)備上進行本地私有化部署的人工智能模型，實現(xiàn)了場景設(shè)備間的智能互聯(lián)，鄒佳思將其稱之為“端側(cè)智能”。他還強調(diào)，端側(cè)智能并非等于云端大模型的小參數(shù)版本。

鄒佳思解釋稱，比起云端智能，使用端側(cè)智能來實現(xiàn)許多生活場景的智能化是更好的選擇。省去云端的參與在允許模型更加個性化的同時，還避免了使用云端可能帶來的個人隱私及成本問題。他認為，現(xiàn)在主流“為云端模型Token付費是一種錯誤的理念，每天全世界的Token消耗達到萬億以上，而其中至少有50%是被浪費掉的”。

鄒佳思承認，從云端邁向端側(cè)智能的過程中，還有許多挑戰(zhàn)存在，包括算力、內(nèi)存等硬件資源受限，實用性要求較高，以及缺少自主學(xué)習(xí)能力等方面。但他認為，一味的堆算力其實扼殺了創(chuàng)新，而人工智能的開發(fā)就像人類，“大家的智力水平可能都差不多，很高很低的都很少，但就是這么一群智商上面差不多的人，我們聚集在一起，可以造火箭，可以造AI，但是單個人是干不成這些事情的?！?/p>

因此RockAI致力于以非Transformer架構(gòu)的模型，開發(fā)設(shè)備端側(cè)的智能設(shè)備，其核心在于使AI擁有原生記憶和自主學(xué)習(xí)的能力，進而最終達到“群體智能”的生態(tài)環(huán)境。

鄒佳思指出，端側(cè)智能的成長在于其自主進化，從“固定工具”到“持續(xù)學(xué)習(xí)”，并從“周期更新”的模式轉(zhuǎn)變?yōu)椤凹磿r成長”，讓大模型不再“死亡”于部署。

以下是鄒佳思的現(xiàn)場演講內(nèi)容，雷峰網(wǎng)作了不改變原意的編輯及整理：

大家好，今天我想探討一個與大家生活密切相關(guān)的主題——設(shè)備端的智能。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

設(shè)想這樣一個場景：在結(jié)束一天的工作后，我倍感疲憊，晚上十點回到家。此時我所期待的應(yīng)該是，推開門時說一句“今天工作很累，想洗個澡立刻休息，明早七點還需早起”，家中設(shè)備能自主啟動一系列操作——例如播放一首悠揚的音樂放松心情、熱水器開始加熱、窗簾自動拉合、設(shè)定明早六點的鬧鐘，甚至預(yù)訂好六點半的早餐。這般景象并非空想，它其實是可以實現(xiàn)的，而且我們預(yù)計將在不久后成為現(xiàn)實。

然而這里存在一個問題：在整個設(shè)備聯(lián)動的過程中，是否真的需要云端參與？不妨想象一些具體情境，例如當(dāng)我走進浴室時，我希望熱水即刻流出，但絕不想某個云端模型看到我正在洗澡、進入浴室或臥室——這樣的畫面很詭異。實際上，這些操作完全可以依賴設(shè)備之間的本地聯(lián)動來完成，無需任何云端介入。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

那為什么會出現(xiàn)云端模型？我們認為，當(dāng)前按Token付費的云端模型模式是一種錯誤的理念。如今全球云端模型每日消耗的Token總量已達萬億甚至百萬億級別。在這龐大的消耗中，究竟有多少是真正有效或值得的？

再舉一個簡單例子：假設(shè)我對著手機說“給隔壁老王發(fā)送一條生日祝福短信”。如果是云端的模型，執(zhí)行這個指令的流程是：這段語音需先傳輸至云端模型，由云端解析為文字，再交由大模型處理并轉(zhuǎn)換為指令，傳回本地手機后打開本地應(yīng)用，可見此鏈路非常復(fù)雜非常繞遠。技術(shù)追求簡單，簡單即真理，因此我們判斷，至少有50%的Token實際是被浪費的。

包括之前提及的家居場景，其實那個場景可能完全無需云端參與。正因如此，我們更關(guān)注端側(cè)智能的發(fā)展。事實上，端側(cè)智能今年已引起廣泛關(guān)注，眾多公司開始在此領(lǐng)域發(fā)力，大模型也逐漸從云端向端側(cè)延伸。有消息稱，OpenAI明年或?qū)l(fā)布自有硬件，并與模型結(jié)合，甚至傳言將訓(xùn)練小參數(shù)的模型直接部署于設(shè)備端。由此可見，端側(cè)人工智能確實在持續(xù)演進。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

但端側(cè)智能同樣面臨諸多挑戰(zhàn)，包括實時性、功耗以及有限的計算資源，尤其是硬件方面的限制。其中一個核心問題在于端側(cè)的學(xué)習(xí)能力。因為每臺設(shè)備——無論是手機、PC還是穿戴設(shè)備——都具有高度個性化特征。正因為高度個性化，包含大量個人私有數(shù)據(jù)，模型若要理解這種個性化并與用戶貼近，就必須具備學(xué)習(xí)能力。否則，現(xiàn)行“預(yù)訓(xùn)練-數(shù)據(jù)壓縮-部署至設(shè)備”的模式，將意味著模型失去了成長性。尤其在量化過程中，模型經(jīng)量化后學(xué)習(xí)能力會進一步減弱，而反量化的成本又十分高昂。

當(dāng)單個設(shè)備變得足夠智能，我們身邊又擁有眾多設(shè)備——家居場景中的、隨身穿戴的、工作環(huán)境內(nèi)的——如果這些設(shè)備能夠相互聯(lián)動，是否會催生另一種形態(tài)的智能？就像人類，每個人的技能方向各異，但智力水平大多相近，極高或極低者均屬少數(shù)。正是這樣一群智力相仿的人聚集協(xié)作，能造出火箭、開發(fā)AI，這是單一個體難以完成的事情。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

回到技術(shù)路線。當(dāng)前大模型的發(fā)展仍以Transformer架構(gòu)為主導(dǎo)。過去幾年，焦點多集中于規(guī)?；?xùn)練——依賴更多數(shù)據(jù)、更大算力、更高人才密度，以打造更強大、更全能的模型。暫且不論這般投入是否存有泡沫，實際上，算力的增長正在扼殺創(chuàng)新，也令許多小團隊失去機會。目前國內(nèi)外大模型廠商基本都在拼資源。如果所有參與者都需要如此龐大的資源，創(chuàng)新將從何而來？當(dāng)大家在同一條道路上愈行愈遠，真正的問題在于：模型是否必須足夠大？數(shù)據(jù)是否必須海量？我個人或許未曾讀過上千本書，但這并不妨礙我今天在此分享觀點，也不妨礙我從事AI行業(yè)。我必然沒有一個大模型懂得多，它可能已遍覽所有的書籍與資料，但人類的進化與工作方式并非如此。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

現(xiàn)在的云端模型還可通過在線檢索等方式獲取實時知識，但依賴搜索來實現(xiàn)這一功能本身已顯不足。因此我們認為，靜態(tài)的函數(shù)壓縮式智能難以誕生真正的智能。

第二個問題是：更多參數(shù)是否意味著更強智能？我們認為參數(shù)量的擴大僅是擴展了函數(shù)空間的容量，實現(xiàn)了知識的壓縮與傳播，并未真正創(chuàng)造知識。

關(guān)于記憶，目前許多大模型廠商也在探討記憶功能，但現(xiàn)有方案多通過RAG、數(shù)據(jù)庫或上下文等方式實現(xiàn)。這種方式好比借助筆記本記錄數(shù)據(jù)，卻沒有真正進入模型的大腦。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

因此對于未來的智能硬件而言，我們認為最重要的在于原生記憶與自主學(xué)習(xí)能力。記憶可分為多個維度，包括形態(tài)記憶與知識記憶。形態(tài)記憶指模型記住一串?dāng)?shù)字、一個電話號碼或銀行卡號；知識記憶則不同，它并非具體數(shù)字，而是經(jīng)大腦轉(zhuǎn)化后形成的知識，例如我正在輸出的觀點。

更高一層是記憶所構(gòu)成的世界觀。如同人類三觀的形成，它并不是靠別人在某一天告訴你“應(yīng)該成為怎樣的人”，而是通過長期記憶與學(xué)習(xí)逐步構(gòu)建的價值觀。若模型僅有外部接入的記憶，或自身缺乏記憶能力，那么所謂的模型個性化及后續(xù)進化幾乎都難以實現(xiàn)。

除了記憶，設(shè)備端與云端的一大差異在于設(shè)備端具有部署屬性。或許有人質(zhì)疑：設(shè)備端也可以聯(lián)網(wǎng)，那么接入云端模型是否也能實現(xiàn)相同的功能？以人臉識別為例：早期人臉識別多在云端完成，如今卻幾乎全部移至設(shè)備端。這不僅是時延與隱私的考量，也涉及成本問題。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

因此我們認為，大模型的發(fā)展方向應(yīng)從固定工具轉(zhuǎn)向持續(xù)學(xué)習(xí)，從每三月或半年更新一次的知識庫，轉(zhuǎn)變?yōu)槟軌驅(qū)崟r成長的系統(tǒng)。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

這是我們RockAI開發(fā)的非Transformer架構(gòu)Yan大模型，其主要特點包括兩項核心技術(shù)：一是記憶模塊，二是選擇激活機制。記憶模塊被內(nèi)置在模型架構(gòu)中，能更精準地控制細密度，從而在學(xué)習(xí)時，更新參數(shù)的權(quán)重會具有更準確的靶點靶向。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

通過這張對比表可以看出，非Transformer架構(gòu)在多項指標(biāo)上與Transformer架構(gòu)模型效果差異不大。當(dāng)然Transformer在某些指標(biāo)上仍優(yōu)于我們，因此我們尚有提升空間。但在總體發(fā)展方向上，非Transformer架構(gòu)應(yīng)該占有一席之地。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

這里做一個簡短演示（今年世界人工智能大會也曾現(xiàn)場展示）：把模型部署到手機上，通過手機學(xué)習(xí)某些概念、動作或知識，進而指揮機器狗完成指定任務(wù)。

從視頻可以看出，端側(cè)模型在許多情境下具備很強的理解能力。它能夠從非設(shè)備本體的動作中抽象出概念，進而組合設(shè)備的原子能力并重新編排，以復(fù)現(xiàn)該動作。

此類應(yīng)用場景本質(zhì)上十分廣泛。例如：一位老人對空調(diào)說“我的小孫子每天下午三點踢完足球回家時滿頭大汗，不要對著他吹風(fēng)，同時將溫度調(diào)至28度以上?！边@整段話是一個完整訴求，老人希望空調(diào)在檢測到小孩子進門時自動執(zhí)行該指令。該指令本質(zhì)上涵蓋多層技術(shù)，包括模型理解、圖像理解以及記憶能力——模型需記住訴求，并在每次孩子回來時重復(fù)執(zhí)行，這是真正可落地的應(yīng)用。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

我們認為當(dāng)前許多硬件仍處于偏靜態(tài)的階段，即便是一些小型設(shè)備終端，尤其像AI玩具，其本質(zhì)仍是以玩具為主體，只是掛載了接入云端模型的AI功能，AI并未真正融入設(shè)備本體。

因此它的AI功能并無本質(zhì)上的差異化。對小朋友來說，它無法產(chǎn)生陪伴感，因為模型不具備情感反饋，不能隨使用者學(xué)習(xí)，也無法理解情緒表達的差異——例如上一次與這一次不開心有什么不同，也無法理解你期望它做些什么。

而當(dāng)AI具備原生記憶與自主學(xué)習(xí)能力后，我們認為不僅Token收費模式將終結(jié)，整個設(shè)備端也會愈加個性化、富有情感且更了解用戶。屆時，軟件與硬件方能實現(xiàn)真正融合。

我們認為，優(yōu)秀的AI硬件應(yīng)是讓人感受不到AI的存在——正如如今人們過閘機時，不會意識到背后有強大的人臉識別在運作，只覺得它自然解決了問題。但當(dāng)前許多設(shè)備，包括云端服務(wù)器及應(yīng)用，仍讓人強烈感知到“這是一個AI”。我們距離真正的AI普及乃至AGI仍有鴻溝需要跨越。只有當(dāng)大家不再察覺AI存在時，才意味著AI真正融入了日常生活。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

RockAI目前主要聚焦于消費電子類設(shè)備，包括平板、PC、機器人等方向。這里有一個比較典型的案例可供參考，這個能力現(xiàn)已應(yīng)用于多款機器人。

當(dāng)然，該模型支持的模態(tài)仍有限，距離理解更多模態(tài)還有很長的路要走。我們也認識到當(dāng)前模型在數(shù)據(jù)與模態(tài)理解等方面面臨的困境，但這件事值得投入。至少我們相信，自己正走在正確的道路上。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

這張圖包含的內(nèi)容很多，但其核心想表達的是“群體智能”這四個字。這是我們公司以及學(xué)界部分專家認為更具可行性、方向更明確的一條路徑。我們不確定一個擁有十幾萬億參數(shù)的模型未來能否成為全面的“六邊形戰(zhàn)士”，但自然界已給了我們許多啟示——比如人類和動物的群體協(xié)作。

回顧最初所舉的例子，其中80%的問題或許完全可以由設(shè)備間協(xié)作解決。最終落實到日常生活，我們設(shè)想的未來將是云端與設(shè)備端相結(jié)合、按比例分配協(xié)作的模式。

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

我們?nèi)匀黄诖O(shè)備間能夠互聯(lián)，最終實現(xiàn)群體智能，讓設(shè)備互聯(lián)涌現(xiàn)出一種新的智能形態(tài)。當(dāng)Transformer道路抵達盡頭，面臨參數(shù)與規(guī)模的極限時，我們堅信需要在架構(gòu)上創(chuàng)新，而非僅在現(xiàn)有路徑上不斷堆積數(shù)據(jù)與算力，因為那或許是一條不歸路。國家層面與全球經(jīng)濟因素暫且不論，僅從技術(shù)角度出發(fā)，新的路線亟待出現(xiàn)。

感謝各位，我今天的分享就到這里。

下面是在演講之后，針對講座的問答環(huán)節(jié)

問：對于端側(cè)智能是一定要用非 transformer 架構(gòu)做嗎？

鄒佳思：這個也不一定，我們是覺得在路線上最起碼是應(yīng)該百花齊放的，因為單一的架構(gòu)，大家其實也看到很多問題，比如算力、數(shù)據(jù)、還有超高的人才密度，這些其實是顯而易見的問題。還有像端側(cè)落地的模型怎么變小，模型怎么能跑得起來？這些是架構(gòu)層面存在的問題。既然有問題，肯定有對應(yīng)的新的方式去解決，只不過我們是走了一個新的方式而已?，F(xiàn)在看不出來哪個路線能走到最后，但是多一條路線，多一個選擇，多一些可能性。

問：為什么選擇現(xiàn)在Yan架構(gòu)的這個路線？

鄒佳思：其實早期的時候主要還是因為設(shè)備上資源的限制，我們從2021年開始做的時候，其實當(dāng)時的設(shè)備比現(xiàn)在的很多算力資源還要低。即使是Transformer架構(gòu)的3B模型在當(dāng)時也跑不起來，但我們并不想等產(chǎn)品進化到滿足條件后再來做這件事情。所以我們一直在做新的嘗試，一直試到2024年，很多的方案我們都申請了專利，雖然這些方案都失敗了，但是在嘗試的過程中，最后試出來現(xiàn)在Yan模型的方案。我們從2024年1月份Yan 1.0的發(fā)布到Y(jié)an 1.3，整個模型能商業(yè)化、能穩(wěn)定運行，其實也走了差不多一年的時間。

問：如果我用了端側(cè)模型，這個設(shè)備會不會不夠智能了？小愛同學(xué)這種AI也是在云端的，如果把它部署在那么一個小盒子上，它的成本是不是就會很大，或者小愛同學(xué)就不是那么聰明的AI了。

鄒佳思：我們做設(shè)備端有一個很重要的點是它是跟場景掛鉤的，云端的模型大家可能會更傾向于它是一個六邊形戰(zhàn)士，就是它什么都能干，可一旦到了設(shè)備端以后它一定是有偏向的，大家很多的場合也都在講，說這個落地一定要垂直。

而設(shè)備端它有典型的場景限制，就是說我不會用一個手機，或者用一個簡單的設(shè)備干所有的事情。對于這個事情，一旦你走到垂直領(lǐng)域的時候，其實模型端的差異可能就不會那么大?？赡苣阋鉀Q的就是其他問題，比如說功耗，比如說對硬件的需求。

剛才我們也有一頁PPT展示了與其他模型的對比，雖然可能不那么權(quán)威，但還是能看出來一些端倪，就是比如一個小參數(shù)的3B模型，可能它能達到?jīng)]有做過優(yōu)化的8B模型甚至更高的模型的效果，而且這個事情在很多MIT的論文里面已經(jīng)論證過了，就是模型參數(shù)很大，但在解決實際場景的時候，很多參數(shù)其實也是浪費。之前有一篇特別有意思的論文就是關(guān)于一個百億參數(shù)的模型，把很多參數(shù)都給剪裁掉，或者是給 mark掉，但是發(fā)現(xiàn)做任務(wù)的效果其實是一樣的，所以在一定程度上解釋了這個事情。

不過一個3B的模型要跟一個萬億的參數(shù)去比，這肯定是有差距的，但是就要看這個模型實際場景能解決哪些問題。就像現(xiàn)在智能家居的這個場景，如果所有的設(shè)備上都布了一個3B的模型，那它就能幫你解決很多生活里面你需要去做的事情。

講座完整視頻，詳見鏈接：https://youtu.be/-zosrLdozQI

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

張夏寧

編輯

發(fā)私信

當(dāng)月熱門文章

97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

RockAI CMO 鄒佳思：端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」，完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025