0
| 本文作者: 陳淑瑜 | 2026-06-11 14:24 | 專題:ICRA 2017:創(chuàng)新、創(chuàng)業(yè)和解決方法 |

2026年6月初,在維也納國際會議中心落幕的ICRA 2026上,從多瑙河畔傳來消息。
來自賓夕法尼亞大學(xué)GRASP實驗室的博士生Yifei Shao(邵逸飛) 作為第一作者的論文 《SymSkill: Symbol and Skill Co-Invention for Data-Efficient and Real-Time Long-Horizon Manipulation》 一舉斬獲兩項ICRA最高學(xué)術(shù)榮譽:Best Conference Paper Award(大會最佳論文獎) 和 Best Paper Award on Planning and Control(規(guī)劃與控制方向最佳論文獎)。
一篇論文同時攬獲兩項大獎,在ICRA歷史上較為罕見,也標(biāo)志著GRASP實驗室在機(jī)器人規(guī)劃與控制領(lǐng)域的又一次跨越式突破。

01
1.1 問題的原點
讓機(jī)器人在真實世界中執(zhí)行復(fù)雜的多步驟操控任務(wù),一直是機(jī)器人學(xué)最核心也最棘手的挑戰(zhàn)之一?,F(xiàn)有方法主要分為兩大流派,卻各自陷入困境:模仿學(xué)習(xí)反應(yīng)迅速,但缺乏組合泛化能力,學(xué)習(xí)到的往往是“單一體策略”,環(huán)境稍有變化就無法拆解復(fù)用舊技能;而經(jīng)典的任務(wù)與運動規(guī)劃雖然有良好的符號抽象和組合能力,但規(guī)劃延遲動輒數(shù)十秒甚至上百秒,根本無法支持實時故障恢復(fù)。
SymSkill的突破在于——它不再在這兩條路徑中做選擇題,而是搭建了一座橋。論文提出了一套統(tǒng)一的學(xué)習(xí)框架,將兩者的優(yōu)勢無縫融合:離線的共同發(fā)明與在線的實時執(zhí)行。

論文鏈接:https://arxiv.org/html/2510.01661v2
1.2 核心技術(shù)架構(gòu)
SymSkill的核心創(chuàng)新可以概括為兩個階段:
離線階段——共同發(fā)明。 與以往需要人工標(biāo)注和分割演示數(shù)據(jù)的方法不同,SymSkill能夠直接從無標(biāo)簽、無分割的機(jī)器人演示數(shù)據(jù)中,以無監(jiān)督的方式聯(lián)合學(xué)習(xí)謂詞、操作符和目標(biāo)導(dǎo)向技能。這意味著,機(jī)器人只需要觀看少量演示(每個任務(wù)僅需約5次演示數(shù)據(jù)),就能自行“歸納”出完成任務(wù)所需的符號抽象和技能庫。
在線階段——實時組合與恢復(fù)。 執(zhí)行時,一旦用戶指定一個或多個目標(biāo)謂詞,SymSkill就會調(diào)用符號規(guī)劃器來動態(tài)組合和重排已學(xué)技能以達(dá)到符號目標(biāo),同時在運動層級和符號層級同時執(zhí)行故障恢復(fù)。配合柔順控制器,SymSkill能夠在人類和環(huán)境擾動下實現(xiàn)安全、不間斷的執(zhí)行。

1.3 實驗表現(xiàn)與意義
實驗數(shù)據(jù)令人信服。在RoboCasa模擬環(huán)境中,SymSkill成功執(zhí)行了12個單步任務(wù),成功率達(dá)85%;面對需要多達(dá)6次技能重排的多步復(fù)雜任務(wù)時,SymSkill仍能從執(zhí)行失敗中穩(wěn)健恢復(fù)。
而最令學(xué)界驚嘆的是真實機(jī)器人實驗:在一臺真實的Franka機(jī)器人上,SymSkill僅用5分鐘的無分割、無標(biāo)簽玩耍數(shù)據(jù)作為訓(xùn)練素材,僅通過目標(biāo)指令即可操控機(jī)器人執(zhí)行多種任務(wù)。這種數(shù)據(jù)效率在此前的規(guī)劃系統(tǒng)中幾乎不可想象。
這項研究的更深層意義在于,它讓機(jī)器人從“背答案”進(jìn)化到了“理解題目”——不再是簡單記憶動作序列,而是能夠抽象出任務(wù)背后的符號結(jié)構(gòu),并根據(jù)現(xiàn)實變化實時調(diào)整策略。SymSkill為下一代通用家庭服務(wù)機(jī)器人提供了一條從“反應(yīng)型模仿”走向“推理型執(zhí)行”的可行路徑。

02
邵逸飛是賓大計算機(jī)與信息科學(xué)系的博士生,師從Vijay Kumar教授與Pratik Chaudhari教授,主攻符號規(guī)劃與運動規(guī)劃的融合理論。在本研究中,他主導(dǎo)了SymSkill整體框架的設(shè)計與符號規(guī)劃器的開發(fā),是論文核心思想的主要構(gòu)建者。

SymSkill不僅是GRASP實驗室的一項技術(shù)突破,更展現(xiàn)了作者間的默契配合。論文的前三位作者——Yifei Shao、Yuchen Zheng(佐治亞理工phd)和Sunan Sun(GRASP phd)都是來自中國的留學(xué)生——分別在不同環(huán)節(jié)發(fā)揮了關(guān)鍵作用,形成了從理論設(shè)計到實驗驗證的完整鏈條。
在博士研究之外,邵逸飛在本科和碩士階段已經(jīng)打下了扎實的工程功底:他擁有密歇根大學(xué)安娜堡分校的機(jī)器人及機(jī)械工程雙碩士學(xué)位。其研究興趣涵蓋運動規(guī)劃、人機(jī)協(xié)作以及LLM驅(qū)動的機(jī)器人實時糾錯等多個前沿方向。
SymSkill作為邵逸飛以一作身份發(fā)表的重磅研究,可以看作他在符號規(guī)劃、運動控制與安全保證領(lǐng)域的集大成之作。SymSkill提出了一套名為 “符號與技能共同發(fā)明”(Symbol and Skill Co-Invention) 的統(tǒng)一學(xué)習(xí)框架,首次在ICRA舞臺上同時獲得兩項大獎。該工作不僅延續(xù)了邵逸飛在T-RO和RA-L期刊上對運動規(guī)劃實時性、安全性和數(shù)據(jù)效率的持續(xù)關(guān)注,更將符號規(guī)劃從離線的、靜態(tài)的任務(wù)分解提升到了與技能學(xué)習(xí)動態(tài)耦合、可實時故障恢復(fù)的新層次。
SymSkill論文的發(fā)表和雙獎獲得,無疑標(biāo)志著邵逸飛從一位極具潛力的青年學(xué)者正式邁入機(jī)器人學(xué)界的前沿行列。他目前在灣區(qū)機(jī)器人創(chuàng)業(yè)公司(DYNA robotics)實習(xí),探索物理AI和VLA的最前沿方向。

03
如果說Yifei Shao是GRASP實驗室的未來,那么Vijay Kumar就是GRASP的靈魂。Kumar教授是賓夕法尼亞大學(xué)工程與應(yīng)用科學(xué)學(xué)院的Nemirovsky Family院長,他于1987年在俄亥俄州立大學(xué)獲得機(jī)械工程博士學(xué)位,此后一直在賓大任教,至今已近四十年。
3.1 學(xué)術(shù)貢獻(xiàn):從無人機(jī)集群到多機(jī)器人系統(tǒng)
Kumar是當(dāng)今機(jī)器人學(xué)界最具影響力的學(xué)者之一。他的研究跨越多個維度:集體行為——研究生物與機(jī)器人系統(tǒng)中的群體動力學(xué);分布式與去中心化控制——設(shè)計可擴(kuò)展、魯棒的協(xié)作機(jī)器人算法;微型飛行器——他在多旋翼飛行器及無人機(jī)集群方面的研究成果已成為該領(lǐng)域的奠基性工作。
特別值得一提的是,Kumar團(tuán)隊在生物啟發(fā)的機(jī)器人架構(gòu)和非結(jié)構(gòu)化動態(tài)環(huán)境中的自主控制方面取得了大量突破性成果。GRASP實驗室的網(wǎng)頁中專門提到,Kumar的研究核心挑戰(zhàn)包括:在不依賴精確環(huán)境模型的條件下,在非結(jié)構(gòu)化動態(tài)環(huán)境中實現(xiàn)控制、通信與感知的集成——這恰恰與SymSkill試圖解決的長時程操控問題高度吻合。
3.2 榮譽與影響力
Kumar是美國國家工程院院士,同時是ASME和IEEE的會士。他曾擔(dān)任美國白宮科技政策辦公室機(jī)器人與網(wǎng)絡(luò)物理系統(tǒng)助理主任,深度參與了美國國家機(jī)器人計劃的制定。其領(lǐng)導(dǎo)下的GRASP實驗室,成立47年來一直是全球機(jī)器人研究的頂級孵化器。本屆ICRA上,GRASP實驗室共有15位教師、27位博士生在技術(shù)項目中發(fā)表論文,參與組織了12個研討會,并在展區(qū)和競賽中全面亮相。
作為導(dǎo)師,Kumar的研究生培養(yǎng)也成績斐然。在他的指導(dǎo)下,多名學(xué)生畢業(yè)后任職于頂級高校(劍橋大學(xué)、斯坦福大學(xué)、香港科技大學(xué)、東北大學(xué))及產(chǎn)業(yè)界(Skydio、Exyn、Shield AI等)。Yifei Shao是他眾多優(yōu)秀學(xué)生中的一個,但SymSkill的成就無疑讓這段師生關(guān)系增添了濃墨重彩的一筆。

04
4.1 學(xué)術(shù)之路:從EPFL到MIT再到賓大
如果說Vijay Kumar是機(jī)器人學(xué)界的長青樹,那么Nadia Figueroa則是正在升起的一顆耀眼新星。Figueroa現(xiàn)任賓夕法尼亞大學(xué)機(jī)械工程與應(yīng)用力學(xué)系的Shalini and Rajeev Misra Presidential Assistant Professor,同時兼任計算機(jī)與信息科學(xué)系、電氣與系統(tǒng)工程系的職務(wù),是GRASP實驗室的核心教師成員。
她的學(xué)術(shù)履歷令人矚目:2007年獲墨西哥蒙特雷理工學(xué)院機(jī)電工程學(xué)士學(xué)位,2012年獲德國多特蒙德工業(yè)大學(xué)自動化與機(jī)器人碩士學(xué)位,2019年在瑞士洛桑聯(lián)邦理工學(xué)院獲得機(jī)器人、控制與智能系統(tǒng)博士學(xué)位。博士論文榮獲Georges Giralt博士論文獎(歐洲最佳機(jī)器人博士論文)、ABB博士論文獎及EPFL博士卓越獎三項大獎。博士畢業(yè)后,她在MIT計算機(jī)科學(xué)與人工智能實驗室的交互式機(jī)器人組從事了兩年博士后研究,于2022年加入賓大。2025年,她獲得NSF CAREER Award,這一獎項被譽為美國青年學(xué)者在科學(xué)與工程領(lǐng)域的最高榮譽之一。
4.2 研究聚焦:安全、控制與人機(jī)共融
Figueroa的研究聚焦于為人機(jī)協(xié)作機(jī)器人系統(tǒng)開發(fā)安全、控制、估計與學(xué)習(xí)方法。她的核心理念是:機(jī)器人需要能夠在人類生活的動態(tài)空間中,與人和其它機(jī)器人安全且高效地互動。
SymSkill中“配合柔順控制器實現(xiàn)安全不間斷執(zhí)行”的技術(shù),正是Figueroa研究專長的直接體現(xiàn)。她先前的工作已經(jīng)探索了反應(yīng)式策略學(xué)習(xí)與穩(wěn)定性保障的融合問題,為SymSkill提供了底層控制層面的理論支撐。可以說,F(xiàn)igueroa在柔順控制與安全的交叉地帶的深耕,是SymSkill能夠從理論走向?qū)嶒烌炞C的關(guān)鍵一環(huán)。
2016年,她與合作者在機(jī)器人頂級會議RSS(Robotics: Science and Systems)上斬獲最佳學(xué)生論文獎。十年后的ICRA 2026,她作為通訊作者指導(dǎo)博士生Yifei Shao再次登頂,見證了一個學(xué)術(shù)傳承的閉環(huán)。

05
5.1 歷史與規(guī)模
GRASP全稱為General Robotics, Automation, Sensing & Perception Laboratory,成立于1979年,是賓夕法尼亞大學(xué)工程與應(yīng)用科學(xué)學(xué)院內(nèi)的跨學(xué)科學(xué)術(shù)中心。實驗室旨在促進(jìn)學(xué)生、研究人員和教師之間的合作,重點覆蓋視覺、感知、控制系統(tǒng)、自動化和機(jī)器學(xué)習(xí)的基礎(chǔ)研究。經(jīng)過47年的發(fā)展,GRASP已成為全球機(jī)器人領(lǐng)域的核心陣地之一。
根據(jù)GRASP官網(wǎng)披露的數(shù)據(jù),本屆ICRA上,GRASP實驗室在技術(shù)項目中發(fā)表了25篇論文,涉及15位教師作者、7位博士后作者和27位博士生作者。這組數(shù)字本身就說明了GRASP在學(xué)術(shù)界持續(xù)而深厚的產(chǎn)出能力。
5.2 SymSkill與GRASP的“統(tǒng)治力”
本屆ICRA,GRASP實驗室不僅在SymSkill上斬獲雙獎,同實驗室的另一篇論文《Push Anything》也入圍了Best Paper Award on Robot Manipulation and Locomotion方向的Finalist(最終提名)。一家實驗室貢獻(xiàn)兩篇Finalist,GRASP在本屆ICRA的“統(tǒng)治力”可見一斑。除此之外,GRASP的資深研究員Mark Yim還在大會上獲得了T-RO杰出服務(wù)獎。這三項殊榮共同勾勒出了GRASP在機(jī)器人領(lǐng)域從理論研究到人才培養(yǎng)的全方位領(lǐng)先地位。
GRASP實驗室的強(qiáng)勢表現(xiàn)也被媒體稱為ICRA 2026的“雙殺”格局——石冠亞團(tuán)隊與GRASP Lab同日獲得不同方向最高榮譽,這在ICRA歷史上并不多。而對邵逸飛來說,能在博士生四年級就在這樣一個頂級平臺上獲得最高認(rèn)可,無疑為他的學(xué)術(shù)道路打開了無限可能。

06
SymSkill的獲獎,不僅僅是對一項高質(zhì)量研究的學(xué)術(shù)表彰,更是對一種研究范式的肯定——機(jī)器人的智能,不在于記住多少動作序列,而在于能否從少量數(shù)據(jù)中抽象出符號級的認(rèn)知結(jié)構(gòu),并在動態(tài)變化的世界中實時適應(yīng)。
正如SymSkill論文最后一句所暗示的:“The source code and additional analysis can be found on the project website”——代碼已開源。SymSkill的意義不僅在于它贏下了ICRA的最高獎項,更在于它為全球所有機(jī)器人研究者打開了一扇門:門后是一條通往數(shù)據(jù)高效、實時可控、安全可靠的通用機(jī)器人操控的新路徑。
在這個意義上,SymSkill不是終點,而是一個起點。
(本文基于GRASP實驗室官網(wǎng)、ICRA 2026官方報道、SymSkill論文arXiv頁面及相關(guān)人物公開資料撰寫。SymSkill項目主頁:https://symskill.github.io 論文arXiv ID:2510.01661)
去哪看 ICRA 核心【演講/論文】詳解?
為了讓國內(nèi)的研發(fā)者、創(chuàng)業(yè)者與投資人能夠毫無時差地掌握本屆 ICRA 2026 的完整干貨,雷峰網(wǎng)(公眾號:雷峰網(wǎng))已全面上線【ICRA 2026 深度專區(qū)】。
專區(qū)不僅全面收錄了重磅論文的工程化解讀、專家前沿演講,更將持續(xù)更新前方記者的第一手會議動態(tài)。
掃描下方二維碼,或點擊「閱讀原文」關(guān)注專區(qū)。

與全球 8000 名頂尖大腦同步呼吸,搶先透視具身智能的下一個五年!
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章