97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給張夏寧
發(fā)送

0

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

本文作者: 張夏寧   2025-12-22 17:52
導(dǎo)語:當(dāng)Transformer走到盡頭,面對的是參數(shù)和規(guī)模的極限,端側(cè)群體智能或許是AI發(fā)展的另一條出路。

12月12日,第八屆 GAIR 全球人工智能與機器人大會于深圳正式拉開帷幕。

本次大會為期兩天,由GAIR研究院與雷峰網(wǎng)(公眾號:雷峰網(wǎng))聯(lián)合主辦,高文院士任指導(dǎo)委員會主席,楊強院士與朱曉蕊教授任大會主席。

作為AI產(chǎn)學(xué)研投界標(biāo)桿盛會,GAIR自2016年創(chuàng)辦以來,始終堅守“傳承+創(chuàng)新”內(nèi)核,是AI學(xué)界思想接力的陣地、技術(shù)交流的平臺,更是中國AI四十年發(fā)展的精神家園。過去四年大模型驅(qū)動AI產(chǎn)業(yè)加速變革,歲末年初GAIR如約而至,以高質(zhì)量觀點碰撞,為行業(yè)與大眾呈現(xiàn)AI時代的前沿洞見。

本次峰會之上,RockAI CMO鄒佳思以“擺脫Transformer的束縛,讓智能重新定義硬件”為主題,為參會者們帶來了一場精彩紛呈的演講。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

鄒佳思通過提出一個生活場景的假設(shè)作為開場,描繪了一幅充分開發(fā)端側(cè)智能后的日常生活圖景。在設(shè)想中,家庭場景中智能設(shè)備的聯(lián)動無需云端參與。如回家后設(shè)備自動完成放音樂、加熱水、拉窗簾、定鬧鐘、點早餐等操作,這一系列動作,通過在終端設(shè)備上進行本地私有化部署的人工智能模型,實現(xiàn)了場景設(shè)備間的智能互聯(lián),鄒佳思將其稱之為“端側(cè)智能”。他還強調(diào),端側(cè)智能并非等于云端大模型的小參數(shù)版本。

鄒佳思解釋稱,比起云端智能,使用端側(cè)智能來實現(xiàn)許多生活場景的智能化是更好的選擇。省去云端的參與在允許模型更加個性化的同時,還避免了使用云端可能帶來的個人隱私及成本問題。他認為,現(xiàn)在主流“為云端模型Token付費是一種錯誤的理念,每天全世界的Token消耗達到萬億以上,而其中至少有50%是被浪費掉的”。

鄒佳思承認,從云端邁向端側(cè)智能的過程中,還有許多挑戰(zhàn)存在,包括算力、內(nèi)存等硬件資源受限,實用性要求較高,以及缺少自主學(xué)習(xí)能力等方面。但他認為,一味的堆算力其實扼殺了創(chuàng)新,而人工智能的開發(fā)就像人類,“大家的智力水平可能都差不多,很高很低的都很少,但就是這么一群智商上面差不多的人,我們聚集在一起,可以造火箭,可以造AI,但是單個人是干不成這些事情的?!?/p>

因此RockAI致力于以非Transformer架構(gòu)的模型,開發(fā)設(shè)備端側(cè)的智能設(shè)備,其核心在于使AI擁有原生記憶和自主學(xué)習(xí)的能力,進而最終達到“群體智能”的生態(tài)環(huán)境。

鄒佳思指出,端側(cè)智能的成長在于其自主進化,從“固定工具”到“持續(xù)學(xué)習(xí)”,并從“周期更新”的模式轉(zhuǎn)變?yōu)椤凹磿r成長”,讓大模型不再“死亡”于部署。

以下是鄒佳思的現(xiàn)場演講內(nèi)容,雷峰網(wǎng)作了不改變原意的編輯及整理:

大家好,今天我想探討一個與大家生活密切相關(guān)的主題——設(shè)備端的智能。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

設(shè)想這樣一個場景:在結(jié)束一天的工作后,我倍感疲憊,晚上十點回到家。此時我所期待的應(yīng)該是,推開門時說一句“今天工作很累,想洗個澡立刻休息,明早七點還需早起”,家中設(shè)備能自主啟動一系列操作——例如播放一首悠揚的音樂放松心情、熱水器開始加熱、窗簾自動拉合、設(shè)定明早六點的鬧鐘,甚至預(yù)訂好六點半的早餐。這般景象并非空想,它其實是可以實現(xiàn)的,而且我們預(yù)計將在不久后成為現(xiàn)實。

然而這里存在一個問題:在整個設(shè)備聯(lián)動的過程中,是否真的需要云端參與?不妨想象一些具體情境,例如當(dāng)我走進浴室時,我希望熱水即刻流出,但絕不想某個云端模型看到我正在洗澡、進入浴室或臥室——這樣的畫面很詭異。實際上,這些操作完全可以依賴設(shè)備之間的本地聯(lián)動來完成,無需任何云端介入。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

那為什么會出現(xiàn)云端模型?我們認為,當(dāng)前按Token付費的云端模型模式是一種錯誤的理念。如今全球云端模型每日消耗的Token總量已達萬億甚至百萬億級別。在這龐大的消耗中,究竟有多少是真正有效或值得的?

再舉一個簡單例子:假設(shè)我對著手機說“給隔壁老王發(fā)送一條生日祝福短信”。如果是云端的模型,執(zhí)行這個指令的流程是:這段語音需先傳輸至云端模型,由云端解析為文字,再交由大模型處理并轉(zhuǎn)換為指令,傳回本地手機后打開本地應(yīng)用,可見此鏈路非常復(fù)雜非常繞遠。技術(shù)追求簡單,簡單即真理,因此我們判斷,至少有50%的Token實際是被浪費的。

包括之前提及的家居場景,其實那個場景可能完全無需云端參與。正因如此,我們更關(guān)注端側(cè)智能的發(fā)展。事實上,端側(cè)智能今年已引起廣泛關(guān)注,眾多公司開始在此領(lǐng)域發(fā)力,大模型也逐漸從云端向端側(cè)延伸。有消息稱,OpenAI明年或?qū)l(fā)布自有硬件,并與模型結(jié)合,甚至傳言將訓(xùn)練小參數(shù)的模型直接部署于設(shè)備端。由此可見,端側(cè)人工智能確實在持續(xù)演進。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

但端側(cè)智能同樣面臨諸多挑戰(zhàn),包括實時性、功耗以及有限的計算資源,尤其是硬件方面的限制。其中一個核心問題在于端側(cè)的學(xué)習(xí)能力。因為每臺設(shè)備——無論是手機、PC還是穿戴設(shè)備——都具有高度個性化特征。正因為高度個性化,包含大量個人私有數(shù)據(jù),模型若要理解這種個性化并與用戶貼近,就必須具備學(xué)習(xí)能力。否則,現(xiàn)行“預(yù)訓(xùn)練-數(shù)據(jù)壓縮-部署至設(shè)備”的模式,將意味著模型失去了成長性。尤其在量化過程中,模型經(jīng)量化后學(xué)習(xí)能力會進一步減弱,而反量化的成本又十分高昂。

當(dāng)單個設(shè)備變得足夠智能,我們身邊又擁有眾多設(shè)備——家居場景中的、隨身穿戴的、工作環(huán)境內(nèi)的——如果這些設(shè)備能夠相互聯(lián)動,是否會催生另一種形態(tài)的智能?就像人類,每個人的技能方向各異,但智力水平大多相近,極高或極低者均屬少數(shù)。正是這樣一群智力相仿的人聚集協(xié)作,能造出火箭、開發(fā)AI,這是單一個體難以完成的事情。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

回到技術(shù)路線。當(dāng)前大模型的發(fā)展仍以Transformer架構(gòu)為主導(dǎo)。過去幾年,焦點多集中于規(guī)?;?xùn)練——依賴更多數(shù)據(jù)、更大算力、更高人才密度,以打造更強大、更全能的模型。暫且不論這般投入是否存有泡沫,實際上,算力的增長正在扼殺創(chuàng)新,也令許多小團隊失去機會。目前國內(nèi)外大模型廠商基本都在拼資源。如果所有參與者都需要如此龐大的資源,創(chuàng)新將從何而來?當(dāng)大家在同一條道路上愈行愈遠,真正的問題在于:模型是否必須足夠大?數(shù)據(jù)是否必須海量?我個人或許未曾讀過上千本書,但這并不妨礙我今天在此分享觀點,也不妨礙我從事AI行業(yè)。我必然沒有一個大模型懂得多,它可能已遍覽所有的書籍與資料,但人類的進化與工作方式并非如此。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

現(xiàn)在的云端模型還可通過在線檢索等方式獲取實時知識,但依賴搜索來實現(xiàn)這一功能本身已顯不足。因此我們認為,靜態(tài)的函數(shù)壓縮式智能難以誕生真正的智能。

第二個問題是:更多參數(shù)是否意味著更強智能?我們認為參數(shù)量的擴大僅是擴展了函數(shù)空間的容量,實現(xiàn)了知識的壓縮與傳播,并未真正創(chuàng)造知識。

關(guān)于記憶,目前許多大模型廠商也在探討記憶功能,但現(xiàn)有方案多通過RAG、數(shù)據(jù)庫或上下文等方式實現(xiàn)。這種方式好比借助筆記本記錄數(shù)據(jù),卻沒有真正進入模型的大腦。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

因此對于未來的智能硬件而言,我們認為最重要的在于原生記憶與自主學(xué)習(xí)能力。記憶可分為多個維度,包括形態(tài)記憶與知識記憶。形態(tài)記憶指模型記住一串?dāng)?shù)字、一個電話號碼或銀行卡號;知識記憶則不同,它并非具體數(shù)字,而是經(jīng)大腦轉(zhuǎn)化后形成的知識,例如我正在輸出的觀點。

更高一層是記憶所構(gòu)成的世界觀。如同人類三觀的形成,它并不是靠別人在某一天告訴你“應(yīng)該成為怎樣的人”,而是通過長期記憶與學(xué)習(xí)逐步構(gòu)建的價值觀。若模型僅有外部接入的記憶,或自身缺乏記憶能力,那么所謂的模型個性化及后續(xù)進化幾乎都難以實現(xiàn)。

除了記憶,設(shè)備端與云端的一大差異在于設(shè)備端具有部署屬性。或許有人質(zhì)疑:設(shè)備端也可以聯(lián)網(wǎng),那么接入云端模型是否也能實現(xiàn)相同的功能?以人臉識別為例:早期人臉識別多在云端完成,如今卻幾乎全部移至設(shè)備端。這不僅是時延與隱私的考量,也涉及成本問題。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

因此我們認為,大模型的發(fā)展方向應(yīng)從固定工具轉(zhuǎn)向持續(xù)學(xué)習(xí),從每三月或半年更新一次的知識庫,轉(zhuǎn)變?yōu)槟軌驅(qū)崟r成長的系統(tǒng)。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

這是我們RockAI開發(fā)的非Transformer架構(gòu)Yan大模型,其主要特點包括兩項核心技術(shù):一是記憶模塊,二是選擇激活機制。記憶模塊被內(nèi)置在模型架構(gòu)中,能更精準地控制細密度,從而在學(xué)習(xí)時,更新參數(shù)的權(quán)重會具有更準確的靶點靶向。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

通過這張對比表可以看出,非Transformer架構(gòu)在多項指標(biāo)上與Transformer架構(gòu)模型效果差異不大。當(dāng)然Transformer在某些指標(biāo)上仍優(yōu)于我們,因此我們尚有提升空間。但在總體發(fā)展方向上,非Transformer架構(gòu)應(yīng)該占有一席之地。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

這里做一個簡短演示(今年世界人工智能大會也曾現(xiàn)場展示):把模型部署到手機上,通過手機學(xué)習(xí)某些概念、動作或知識,進而指揮機器狗完成指定任務(wù)。

從視頻可以看出,端側(cè)模型在許多情境下具備很強的理解能力。它能夠從非設(shè)備本體的動作中抽象出概念,進而組合設(shè)備的原子能力并重新編排,以復(fù)現(xiàn)該動作。

此類應(yīng)用場景本質(zhì)上十分廣泛。例如:一位老人對空調(diào)說“我的小孫子每天下午三點踢完足球回家時滿頭大汗,不要對著他吹風(fēng),同時將溫度調(diào)至28度以上?!边@整段話是一個完整訴求,老人希望空調(diào)在檢測到小孩子進門時自動執(zhí)行該指令。該指令本質(zhì)上涵蓋多層技術(shù),包括模型理解、圖像理解以及記憶能力——模型需記住訴求,并在每次孩子回來時重復(fù)執(zhí)行,這是真正可落地的應(yīng)用。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

我們認為當(dāng)前許多硬件仍處于偏靜態(tài)的階段,即便是一些小型設(shè)備終端,尤其像AI玩具,其本質(zhì)仍是以玩具為主體,只是掛載了接入云端模型的AI功能,AI并未真正融入設(shè)備本體。

因此它的AI功能并無本質(zhì)上的差異化。對小朋友來說,它無法產(chǎn)生陪伴感,因為模型不具備情感反饋,不能隨使用者學(xué)習(xí),也無法理解情緒表達的差異——例如上一次與這一次不開心有什么不同,也無法理解你期望它做些什么。

而當(dāng)AI具備原生記憶與自主學(xué)習(xí)能力后,我們認為不僅Token收費模式將終結(jié),整個設(shè)備端也會愈加個性化、富有情感且更了解用戶。屆時,軟件與硬件方能實現(xiàn)真正融合。

我們認為,優(yōu)秀的AI硬件應(yīng)是讓人感受不到AI的存在——正如如今人們過閘機時,不會意識到背后有強大的人臉識別在運作,只覺得它自然解決了問題。但當(dāng)前許多設(shè)備,包括云端服務(wù)器及應(yīng)用,仍讓人強烈感知到“這是一個AI”。我們距離真正的AI普及乃至AGI仍有鴻溝需要跨越。只有當(dāng)大家不再察覺AI存在時,才意味著AI真正融入了日常生活。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

RockAI目前主要聚焦于消費電子類設(shè)備,包括平板、PC、機器人等方向。這里有一個比較典型的案例可供參考,這個能力現(xiàn)已應(yīng)用于多款機器人。

當(dāng)然,該模型支持的模態(tài)仍有限,距離理解更多模態(tài)還有很長的路要走。我們也認識到當(dāng)前模型在數(shù)據(jù)與模態(tài)理解等方面面臨的困境,但這件事值得投入。至少我們相信,自己正走在正確的道路上。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

這張圖包含的內(nèi)容很多,但其核心想表達的是“群體智能”這四個字。這是我們公司以及學(xué)界部分專家認為更具可行性、方向更明確的一條路徑。我們不確定一個擁有十幾萬億參數(shù)的模型未來能否成為全面的“六邊形戰(zhàn)士”,但自然界已給了我們許多啟示——比如人類和動物的群體協(xié)作。

回顧最初所舉的例子,其中80%的問題或許完全可以由設(shè)備間協(xié)作解決。最終落實到日常生活,我們設(shè)想的未來將是云端與設(shè)備端相結(jié)合、按比例分配協(xié)作的模式。

RockAI CMO 鄒佳思:端側(cè)智能如何通過「原生記憶」與「自主學(xué)習(xí)」,完成從工具邁向伙伴的人機關(guān)系丨GAIR 2025

我們?nèi)匀黄诖O(shè)備間能夠互聯(lián),最終實現(xiàn)群體智能,讓設(shè)備互聯(lián)涌現(xiàn)出一種新的智能形態(tài)。當(dāng)Transformer道路抵達盡頭,面臨參數(shù)與規(guī)模的極限時,我們堅信需要在架構(gòu)上創(chuàng)新,而非僅在現(xiàn)有路徑上不斷堆積數(shù)據(jù)與算力,因為那或許是一條不歸路。國家層面與全球經(jīng)濟因素暫且不論,僅從技術(shù)角度出發(fā),新的路線亟待出現(xiàn)。

感謝各位,我今天的分享就到這里。

下面是在演講之后,針對講座的問答環(huán)節(jié)

問:對于端側(cè)智能是一定要用非 transformer 架構(gòu)做嗎?

鄒佳思:這個也不一定,我們是覺得在路線上最起碼是應(yīng)該百花齊放的,因為單一的架構(gòu),大家其實也看到很多問題,比如算力、數(shù)據(jù)、還有超高的人才密度,這些其實是顯而易見的問題。還有像端側(cè)落地的模型怎么變小,模型怎么能跑得起來?這些是架構(gòu)層面存在的問題。既然有問題,肯定有對應(yīng)的新的方式去解決,只不過我們是走了一個新的方式而已?,F(xiàn)在看不出來哪個路線能走到最后,但是多一條路線,多一個選擇,多一些可能性。

問:為什么選擇現(xiàn)在Yan架構(gòu)的這個路線?

鄒佳思:其實早期的時候主要還是因為設(shè)備上資源的限制,我們從2021年開始做的時候,其實當(dāng)時的設(shè)備比現(xiàn)在的很多算力資源還要低。即使是Transformer架構(gòu)的3B模型在當(dāng)時也跑不起來,但我們并不想等產(chǎn)品進化到滿足條件后再來做這件事情。所以我們一直在做新的嘗試,一直試到2024年,很多的方案我們都申請了專利,雖然這些方案都失敗了,但是在嘗試的過程中,最后試出來現(xiàn)在Yan模型的方案。我們從2024年1月份Yan 1.0的發(fā)布到Y(jié)an 1.3,整個模型能商業(yè)化、能穩(wěn)定運行,其實也走了差不多一年的時間。

問:如果我用了端側(cè)模型,這個設(shè)備會不會不夠智能了?小愛同學(xué)這種AI也是在云端的,如果把它部署在那么一個小盒子上,它的成本是不是就會很大,或者小愛同學(xué)就不是那么聰明的AI了。

鄒佳思:我們做設(shè)備端有一個很重要的點是它是跟場景掛鉤的,云端的模型大家可能會更傾向于它是一個六邊形戰(zhàn)士,就是它什么都能干,可一旦到了設(shè)備端以后它一定是有偏向的,大家很多的場合也都在講,說這個落地一定要垂直。

而設(shè)備端它有典型的場景限制,就是說我不會用一個手機,或者用一個簡單的設(shè)備干所有的事情。對于這個事情,一旦你走到垂直領(lǐng)域的時候,其實模型端的差異可能就不會那么大??赡苣阋鉀Q的就是其他問題,比如說功耗,比如說對硬件的需求。

剛才我們也有一頁PPT展示了與其他模型的對比,雖然可能不那么權(quán)威,但還是能看出來一些端倪,就是比如一個小參數(shù)的3B模型,可能它能達到?jīng)]有做過優(yōu)化的8B模型甚至更高的模型的效果,而且這個事情在很多MIT的論文里面已經(jīng)論證過了,就是模型參數(shù)很大,但在解決實際場景的時候,很多參數(shù)其實也是浪費。之前有一篇特別有意思的論文就是關(guān)于一個百億參數(shù)的模型,把很多參數(shù)都給剪裁掉,或者是給 mark掉,但是發(fā)現(xiàn)做任務(wù)的效果其實是一樣的,所以在一定程度上解釋了這個事情。

不過一個3B的模型要跟一個萬億的參數(shù)去比,這肯定是有差距的,但是就要看這個模型實際場景能解決哪些問題。就像現(xiàn)在智能家居的這個場景,如果所有的設(shè)備上都布了一個3B的模型,那它就能幫你解決很多生活里面你需要去做的事情。

講座完整視頻,詳見鏈接:https://youtu.be/-zosrLdozQI

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說
明星| 白朗县| 天水市| 商洛市| 田东县| 营口市| 五家渠市| 金川县| 台北县| 咸阳市| 香河县| 莱西市| 晋城| 连南| 临朐县| 隆化县| 乌兰县| 林甸县| 茶陵县| 永泰县| 定州市| 郁南县| 屯留县| 铜梁县| 宜章县| 新民市| 保德县| 安图县| 隆昌县| 中西区| 出国| 班玛县| 子洲县| 新民市| 台湾省| 米易县| 宜城市| 湘阴县| 都昌县| 新竹市| 娄底市|