97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
機(jī)器人 正文
發(fā)私信給高景輝
發(fā)送

0

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

本文作者: 高景輝   2026-05-11 13:10
導(dǎo)語:機(jī)器人離落地干活又近了一步。
跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始
機(jī)器人離落地干活又近了一步。

    作者丨高景輝

    編輯丨馬曉寧

                                                                                                       

“機(jī)器人都能做后空翻、跑馬拉松了,怎么還是干不了活?”

在有關(guān)具身機(jī)器人的視頻評(píng)論區(qū),我們總能看到這樣的疑問。

的確,縱觀行業(yè)當(dāng)前的大部分具身機(jī)器人,在嘗試“干活”的時(shí)候總會(huì)遇到尷尬場(chǎng)面:要么一次只能干一件事,一點(diǎn)都不“通用”;要么經(jīng)??D,需要人為干預(yù);要么換了個(gè)機(jī)型,就動(dòng)不了了。

這不禁令人疑惑:具身智能離真正幫我們干活,到底還有多遠(yuǎn)?

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

01

 Motubrain 雙榜登頂,

機(jī)器人干活能力有了 “合格線”

很多人把具身機(jī)器人干不了活,歸咎為模型能力不足,無法勝任各種場(chǎng)景的干活需求。但事實(shí)果真如此嗎?

人們想交給具身智能來干的活千千萬萬,既包含復(fù)雜的操作,也有相對(duì)簡(jiǎn)單的動(dòng)作,能切入的方向理論上很多,按照目前行業(yè)頂尖模型的能力,未必不能駕馭。

所以,不能將具身智能干活難的問題,全算在“能力”頭上。在能力之外,一個(gè)被忽視的問題是,大家對(duì)于“干活”的定義沒有統(tǒng)一,究竟做到什么程度才算“能干活”?評(píng)價(jià)一個(gè)機(jī)器人干活的綜合能力,又要看哪些方面的表現(xiàn)?

換句話說,如果不能用一張“試卷”考核機(jī)器人的干活能力,那么評(píng)判機(jī)器人的“干活”水平就將失去意義。

這種背景下,國際權(quán)威 Benchmark 榜單的參考價(jià)值被進(jìn)一步放大。尤其是覆蓋不同核心能力維度的多個(gè)榜單,綜合來看能更全面地驗(yàn)證模型的商用潛力。

以最近的例子來說,不久前通用世界行動(dòng)模型 Motubrain,就同時(shí)登頂 WorldArena 與 RoboTwin2.0 兩大國際具身智能權(quán)威榜單。Motubrain 背后的生數(shù)科技,也漸漸浮出水面。

具體來看,WorldArena 榜單聚焦模型對(duì)真實(shí)世界的理解與預(yù)測(cè)能力,核心衡量模型對(duì)物理規(guī)律、運(yùn)動(dòng)變化、環(huán)境狀態(tài)的認(rèn)知水平。在該榜單中,Motubrain 總體 EWM Score 達(dá)到 63.77,位列總榜第一,同時(shí)在 Motion Quality、Flow Score、Motion Smoothness 等多個(gè)核心運(yùn)動(dòng)維度均拿下榜首。

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

RoboTwin2.0 榜單則聚焦機(jī)器人的任務(wù)執(zhí)行與泛化能力,衡量模型在多任務(wù)、多環(huán)境、隨機(jī)擾動(dòng)下的穩(wěn)定執(zhí)行表現(xiàn)。在該榜單中,Motubrain 在 Clean 與 Randomized 兩個(gè)場(chǎng)景下分別取得 95.8 與 96.1 的成績(jī),位列總榜第一,也是榜單上唯一一個(gè)在隨機(jī)環(huán)境下平均分超過 95 的模型。

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

雷峰網(wǎng)觀察到,過去行業(yè)內(nèi)的技術(shù)探索大多存在能力偏科。部分模型在世界建模維度表現(xiàn)突出,但無法轉(zhuǎn)化為穩(wěn)定的執(zhí)行能力;部分模型能完成固定動(dòng)作,卻無法適配環(huán)境的隨機(jī)變化。極少有模型能同時(shí)在世界理解與動(dòng)作執(zhí)行兩個(gè)核心維度,做到行業(yè)頂尖水平。

更多地,Motubrain展現(xiàn)出遠(yuǎn)高于VLA的多任務(wù)泛化性曲線和數(shù)據(jù)scaling曲線。從左圖可以看出,隨著任務(wù)數(shù)量增加,Pi-0.5成功率持續(xù)下降,而MotuBrain成功率持續(xù)上升——這說明它學(xué)到了跨任務(wù)的通用世界知識(shí),這是 VLA 不具有的能力。

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

從右圖可以看出,Motubrain 的在數(shù)據(jù)量上的 Scaling Law 曲線相比其他模型更陡峭,說明其數(shù)據(jù)效率非常高,僅用少量數(shù)據(jù)就可以取得很好的結(jié)果。

此外,任務(wù)數(shù)量的 scaling law 曲線比數(shù)據(jù)量更為陡峭,說明對(duì)于 Motubrain 這種數(shù)據(jù)效率極高的模型來說,相比于增加數(shù)據(jù)量,增加任務(wù)的多樣性對(duì)成功率的提升效果更為顯著。

所以,Motubrain 雙榜同時(shí)登頂?shù)暮诵膬r(jià)值,在于它確立了通用機(jī)器人大腦干活能力的參照系。兩大榜單的核心維度,共同構(gòu)成了通用機(jī)器人大腦“能干活”的合格線,也為未來具身智能在場(chǎng)景落地,注入了更強(qiáng)的確定性。

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

02

機(jī)器人“干活”,到底需要哪些模型能力?

既然有了參照系,就不可避免地要回答一個(gè)問題:機(jī)器人落地“干活”,到底需要哪些模型能力?

這個(gè)問題其實(shí)不難回答,看看我們「人」在干活的時(shí)候需要哪些能力就知道了。

比如餐館的工作人員,一個(gè)人可能要身兼數(shù)職,包括點(diǎn)餐、送餐、收臺(tái)、巡場(chǎng)甚至后廚協(xié)助,他們所需要的,是一種“通用”能力,放在具身模型上,就是一個(gè)“大腦”接管所有崗位,這就要求機(jī)器人的大腦能實(shí)現(xiàn)“一腦多能”。

這對(duì)于當(dāng)下的頂尖大模型來說并非難事。比如 Motubrain 在多任務(wù)場(chǎng)景中能夠保持穩(wěn)定表現(xiàn),而且隨著任務(wù)數(shù)量持續(xù)增加,模型共享到的世界知識(shí)越多,平均任務(wù)成功率反而同步提升,且任務(wù)之間不再爭(zhēng)奪模型容量,反而相互促進(jìn)。

從生數(shù)科技發(fā)布的真機(jī)演示 Demo 可以看到,Motubrain 在“調(diào)酒”任務(wù)中,能抓取不同大小、材質(zhì)的容器,并將酒一滴不撒地倒入酒杯中,也能抓取薄荷葉這類柔性物品。至少要具備這種程度的通用性,機(jī)器人才真正上得了崗。

還有,人在做家務(wù)活時(shí)需要足夠“連貫”,一次性完成所有瑣碎的動(dòng)作。但很反直覺的是,家務(wù)活中對(duì)人來說簡(jiǎn)單不過的部分,對(duì)機(jī)器人很可能是相當(dāng)復(fù)雜的。

比如“倒杯水”這個(gè)簡(jiǎn)單指令背后其實(shí)是一長(zhǎng)串任務(wù),包括抓取杯子、從廚房取一杯水、避開地上雜物、識(shí)別臥室門口、放在床頭柜上并且不打翻藥瓶……這中間涉及移動(dòng)、抓取、避障、放置等多個(gè)動(dòng)作,還夾雜環(huán)境變化。傳統(tǒng)做法依賴上層任務(wù)拆解、狀態(tài)機(jī)或快慢系統(tǒng)拼接,每一步都可能引入額外延遲和失敗風(fēng)險(xiǎn)。

但如果像 Motubrain 一樣有了“一腦貫通”能力,就能夠直接學(xué)習(xí)完整任務(wù)鏈路,無需上層規(guī)劃拼接,而且人類無需在中間反復(fù)干預(yù),用戶體驗(yàn)直線上升。畢竟,Motubrain 可以完成超過 10 個(gè)原子動(dòng)作的復(fù)雜長(zhǎng)程任務(wù),而不是僅停留在兩三個(gè)動(dòng)作的演示階段。

在生數(shù)科技發(fā)布的 Demo 中,Motubrain 演示了“插花”這一長(zhǎng)程任務(wù),包含多次撿花、插花的動(dòng)作,以及多次拿起水壺噴水的動(dòng)作,整個(gè)過程十分絲滑,像一個(gè)整體而非“分解動(dòng)作”,似乎預(yù)示著“干家務(wù)”已難不倒具身模型了。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))觀察到,社交媒體上有不少人說,希望能有一個(gè)機(jī)器人“球搭子”,在約不到人的時(shí)候陪自己打打球,這種語境下打球也可以視為一種“干活”,但對(duì)機(jī)器人模型“預(yù)測(cè)”能力有很高要求。因?yàn)橄窬W(wǎng)球這類運(yùn)動(dòng),其球速往往在每小時(shí)100km以上,已超過了當(dāng)前機(jī)器人的硬件能力的上限,等感知到球再揮拍已來不及,必須在人擊球時(shí)做出預(yù)測(cè),這就依賴于世界模型的能力。

Motubrain 也確實(shí)是為數(shù)不多能實(shí)現(xiàn)“一腦預(yù)見”,將理解世界、預(yù)測(cè)世界和執(zhí)行動(dòng)作統(tǒng)一建模的模型。它不只是執(zhí)行一步指令,而是能推演環(huán)境變化,并據(jù)此生成更合理的動(dòng)作路徑,而且預(yù)測(cè)球路和驅(qū)動(dòng)身體揮拍會(huì)成為同一模型下的兩種推理模式,延遲更低,決策更連貫。

當(dāng)然,也有些問題是人不會(huì)遇到的,比如令無數(shù)模型廠商頭疼的“泛化”問題。人都是同一個(gè)物種,身體結(jié)構(gòu)都是一樣的,基本不會(huì)出現(xiàn)多一個(gè)關(guān)節(jié)、少一個(gè)器官的情況。但機(jī)器人形態(tài)各異,構(gòu)造無法保持一致,這就需要一種“一腦多型”的能力,讓模型能夠吸收生態(tài)內(nèi)越來越豐富的異構(gòu)數(shù)據(jù)。

Motubrain 的解決思路,是從一開始就面向多機(jī)器人本體。它不是為某一臺(tái)機(jī)器量身定制,而是用統(tǒng)一的 action 表征打通不同本體,從而適配輪式、臂式、復(fù)合式等多種形態(tài)。隨著機(jī)器人種類和場(chǎng)景不斷增長(zhǎng),模型通用性持續(xù)提升,又會(huì)進(jìn)一步反哺每一類機(jī)器人的實(shí)際表現(xiàn)。

那么,為什么 Motubrain 可以同時(shí)具備這四種能力?

最根本的原因在于,Motubrain 是一個(gè)通用世界行動(dòng)模型(WAM),其核心差異在于模型的訓(xùn)練范式——通過 UniDiffuser 統(tǒng)一建模和調(diào)度 video 與 action 兩個(gè)連續(xù)模態(tài)。一次訓(xùn)練,即可推理出五類分布:視覺-語言-動(dòng)作(VLA)、世界模型、視頻生成、逆動(dòng)力學(xué)、視頻-動(dòng)作聯(lián)合預(yù)測(cè)。

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

這種大一統(tǒng)建模帶來的直接結(jié)果是數(shù)據(jù)吸收能力的質(zhì)變。傳統(tǒng) VLA 只能從特定機(jī)器人本體的完整任務(wù)軌跡數(shù)據(jù)中學(xué)習(xí)。Motubrain 可以同時(shí)利用缺少 action 模態(tài)的純視頻數(shù)據(jù)、缺少語言任務(wù)標(biāo)簽的任務(wù)無關(guān)數(shù)據(jù),以及包含 video、action、language 的完整軌跡數(shù)據(jù)。模型學(xué)到的,是任務(wù)、環(huán)境變化和動(dòng)作后果之間的共享世界知識(shí)。

這也是多任務(wù)正向 scaling 的根基:任務(wù)越多,共享的世界知識(shí)越豐富,模型平均成功率隨之提升。

不過,Motubrain 并非“橫空出世”的大模型,在此之前已有深厚的鋪墊。

其實(shí)但凡對(duì)模型領(lǐng)域有了解的人,都能從名字猜出 Motubrain 和 Motus 之間的聯(lián)系。早在2025年12月,生數(shù)科技就開源了 Motus,比行業(yè)早兩個(gè)月提出并驗(yàn)證了 World Action Models 的核心思想。

在Motus的基礎(chǔ)上,Motubrain完成了一次躍遷:用任意視角數(shù)量的統(tǒng)一建模打通不同相機(jī)配置,讓模型不再依賴固定的視覺輸入形態(tài);用統(tǒng)一的 action 表征打通不同機(jī)器人本體;通過自回歸+diffusion 和語言-動(dòng)作-視頻三流 MoT,讓模型可以直接完成超過 10 個(gè)原子動(dòng)作的長(zhǎng)序列任務(wù);并且讓超大規(guī)模具身模型能夠在機(jī)器人上實(shí)現(xiàn)云邊端協(xié)同的實(shí)時(shí)閉環(huán)控制。

這五步跳躍,讓 Motubrain 從一個(gè)學(xué)術(shù)驗(yàn)證型框架,直接切入了“干活”相關(guān)的高要求場(chǎng)景。

Motubrain詳細(xì)內(nèi)容請(qǐng)見:https://www.shengshu.com/zh/motubrain

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

03

從技術(shù)驗(yàn)證到產(chǎn)品落地,才是真正的挑戰(zhàn)

做出一個(gè)能干活的模型,只是具身智能落地的第一步。下一步是把這種干活能力升級(jí)為一種產(chǎn)品力,它的難度往往不亞于技術(shù)研發(fā)本身。

以生數(shù)科技在多模態(tài)領(lǐng)域的另一款產(chǎn)品 Vidu 為例,其全自動(dòng)一鍵成片、高質(zhì)量批量生產(chǎn)視頻的能力,廣受創(chuàng)作型青睞,尤其是“AI解說劇”細(xì)分賽道,Vidu 已成為不少團(tuán)隊(duì)的首選。

這說明,技術(shù)上的領(lǐng)先優(yōu)勢(shì)固然重要,但能夠把技術(shù)轉(zhuǎn)化為客戶愿意付費(fèi)的產(chǎn)品,考驗(yàn)的是公司對(duì)真實(shí)場(chǎng)景需求的理解、對(duì)用戶體驗(yàn)的打磨,以及對(duì)商業(yè)化路徑的持續(xù)探索。而生數(shù)科技在多模態(tài)模型產(chǎn)品化的實(shí)操經(jīng)驗(yàn),對(duì)于具身智能方向的落地具有直接的遷移價(jià)值。

從 Motubrain 的模型發(fā)布到產(chǎn)品落地,生數(shù)科技已經(jīng)開始了前置布局。今年3月,生數(shù)科技在2026中關(guān)村論壇年會(huì)上正式發(fā)布通用世界模型戰(zhàn)略。公司以基座世界模型為核心底層,向上延伸出兩條清晰的業(yè)務(wù)軌道:一條基于世界生成模型,在數(shù)字空間構(gòu)建視頻大模型產(chǎn)品 Vidu,推動(dòng)數(shù)字內(nèi)容的智能化生產(chǎn);另一條基于世界行動(dòng)模型,在物理空間構(gòu)建世界模型產(chǎn)品 Motus,也就是 Motubrain 背后的統(tǒng)一平臺(tái)。兩條軌道共享同一個(gè)底層技術(shù)架構(gòu),形成數(shù)字世界與物理世界的雙向貫通。

跨本體、長(zhǎng)任務(wù)、可預(yù)測(cè)……Motubrain雙榜登頂只是一個(gè)開始

在物理空間的產(chǎn)業(yè)化推進(jìn)上,生數(shù)科技也已經(jīng)與無界動(dòng)力、星塵智能、深樸智能等具身智能企業(yè)達(dá)成戰(zhàn)略合作。這兩次合作讓 Motubrain 走出了“技術(shù)驗(yàn)證”的范疇,形成了“模型能力—本體適配—場(chǎng)景落地”的完整閉環(huán)。

總之,技術(shù)突破決定有沒有,產(chǎn)業(yè)合作決定能不能用起來。兩者結(jié)合,才能支撐具身智能從實(shí)驗(yàn)室走向真實(shí)場(chǎng)景的完整敘事。

最后回到本文的主題,具身智能離真正“能干活”還有多遠(yuǎn)?

答案或許比許多人想象的要近,但也比一些人期待的更遠(yuǎn)。

說“近”,是因?yàn)橄?Motubrain 這樣能夠在世界建模和執(zhí)行能力上同時(shí)站上行業(yè)最頂端的模型正在出現(xiàn)。雙榜第一的意義不僅僅是技術(shù)指標(biāo)的領(lǐng)先,而是它第一次為通用機(jī)器人大腦在落地之前豎起了一把標(biāo)尺——我們知道了什么樣的模型能力,至少具備了在真實(shí)場(chǎng)景中干活的潛力。

說“遠(yuǎn)”,是因?yàn)閺哪P屯黄频酱笠?guī)模部署之間,還有大量的工程化問題和產(chǎn)品化工作要做。機(jī)器人不只是模型,還要適配不同本體的硬件,要適應(yīng)千差萬別的物理環(huán)境,要在用戶端形成真正好用的產(chǎn)品體驗(yàn)。這些都不是一蹴而就的事。

但至少有一點(diǎn)是確定的:過去幾年困擾行業(yè)的最大瓶頸——機(jī)器人大腦缺乏統(tǒng)一、通用的智能能力——正在被一步步突破。當(dāng)行業(yè)的上限在不斷被刷新,距離機(jī)器人在物理世界幫我們干活,就不會(huì)太遠(yuǎn)了。

2026年的具身智能行業(yè),正在從“技術(shù)驗(yàn)證”走向“規(guī)模落地”的關(guān)鍵節(jié)點(diǎn)上,等待那個(gè)“ChatGPT時(shí)刻”的到來。而Motubrain 的出現(xiàn),可能是其中最值得關(guān)注的一個(gè)信號(hào)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說
年辖:市辖区| 焉耆| 扶余县| 丽水市| 江西省| 漠河县| 景东| 邓州市| 镇安县| 通江县| 平舆县| 深州市| 江阴市| 沅江市| 嵩明县| 博湖县| 怀宁县| 金乡县| 高州市| 岳池县| 五华县| 昌乐县| 新余市| 富裕县| 胶州市| 新巴尔虎右旗| 丰台区| 乐都县| 巴青县| 石阡县| 上蔡县| 平山县| 通道| 宁明县| 敦化市| 惠水县| 灵丘县| 东明县| 秭归县| 宜川县| 化隆|