0
| 本文作者: 吳思?jí)?/a> | 2026-06-01 15:10 | 專題:ICRA 國際機(jī)器人與自動(dòng)化會(huì)議 |
原文作者:公眾號(hào)“機(jī)器之心”
原文鏈接:https://mp.weixin.qq.com/s/vPNP8686ZQ09KDzSMn-iaw
本篇文章被 ICRA 2026 接收并獲得 IROS 2025 雙料 Workshop 最佳論文,第一作者張子哲(site: zizhe.io)是賓夕法尼亞大學(xué)機(jī)器人學(xué)碩士生,同時(shí)在 GRASP 實(shí)驗(yàn)室擔(dān)任科研助理,導(dǎo)師為 Nadia Figueroa 教授,研究興趣涵蓋機(jī)器學(xué)習(xí),安全控制以及人機(jī)交互。

論文標(biāo)題:Viability-Preserving Passive Torque Control
論文鏈接:https://arxiv.org/abs/2510.03367
項(xiàng)目主頁:https://vpp-tc.github.io/webpage/
一、一句話總結(jié)
本文提出了 VPP-TC(Viability-Preserving Passive Torque Control),一種基于可行性(viability)理論的被動(dòng)力矩控制框架。該框架在關(guān)節(jié)位置 - 速度的增廣狀態(tài)空間中預(yù)計(jì)算安全集合,將可行性約束轉(zhuǎn)化為關(guān)節(jié)加速度(進(jìn)而力矩)的仿射約束,通過二次規(guī)劃(QP)實(shí)時(shí)求解,確保機(jī)器人在無限時(shí)間范圍內(nèi)始終處于安全集合內(nèi)。相比基于控制屏障函數(shù)(CBF)的基線方法,VPP-TC 無需計(jì)算邊界函數(shù)的二階導(dǎo)數(shù),控制回路頻率更高、軌跡更平滑、路徑更短。

圖 1:VPP-TC 控制框架示意圖。關(guān)節(jié)限位的力矩約束通過解析方法推導(dǎo),自碰撞和外部碰撞約束通過數(shù)據(jù)驅(qū)動(dòng)方法學(xué)習(xí)。
二、研究背景與動(dòng)機(jī)
在物理人機(jī)交互(pHRI)場景中,機(jī)器人需要在與人類近距離協(xié)作時(shí)保持被動(dòng)性(passivity)—— 即吸收的能量不少于釋放的能量,從而保證在外部擾動(dòng)下的魯棒性和穩(wěn)定性。經(jīng)典的阻抗 / 導(dǎo)納控制框架、Port-Hamiltonian 方法以及基于動(dòng)力系統(tǒng)(DS)的被動(dòng)力矩控制器已被廣泛研究。
然而,這類被動(dòng)控制器通常缺乏顯式的約束處理能力,無法保證在整個(gè)任務(wù)執(zhí)行過程中的碰撞避免和關(guān)節(jié)限位滿足。先前工作 CPIC 利用控制屏障函數(shù)(CBF)框架和指數(shù)控制屏障函數(shù)(ECBF)來約束被動(dòng)力矩控制器,但存在以下問題:
硬約束之間可能互相沖突,導(dǎo)致 QP 不可行;
QP 框架易陷入死鎖和關(guān)節(jié)空間的局部最小值;
ECBF 需要計(jì)算邊界函數(shù)的 Hessian 矩陣(二階導(dǎo)數(shù)),當(dāng)邊界由神經(jīng)網(wǎng)絡(luò)表示時(shí),實(shí)時(shí)性難以保證。
正是這些局限性,促使作者提出了基于可行性理論(viability theory)的全新安全控制框架。
三、方法詳解
3.1 核心思想:從 CBF 到 Viability
VPP-TC 的核心創(chuàng)新在于:在關(guān)節(jié)位置 q 和關(guān)節(jié)速度 q?的增廣狀態(tài)空間中引入安全邊界,而非僅在關(guān)節(jié)位置空間中。在這個(gè)增廣空間中操作的好處是,安全約束可以直接推導(dǎo)為關(guān)節(jié)加速度 q?的仿射約束,再通過機(jī)器人動(dòng)力學(xué)方程轉(zhuǎn)化為力矩約束 —— 整個(gè)過程無需計(jì)算邊界函數(shù)的二階導(dǎo)數(shù)。
可行性的定義(Definition 1)是:從可行集 V 中的任意初始狀態(tài)出發(fā),存在一個(gè)控制序列(加速度序列),使得產(chǎn)生的無限長狀態(tài)序列始終在可行集內(nèi)。這比單純的「可行」(feasible)更強(qiáng) —— 一個(gè)可行狀態(tài)可能在未來的控制下離開可行集,但一個(gè) viable 狀態(tài)保證能永遠(yuǎn)留在安全集內(nèi)。

圖 2:可行性(viability)概念。狀態(tài) s1 既可行又 viable,而 s2 可行但不 viable—— 雖然當(dāng)前滿足約束,但不存在一個(gè)控制序列能保證它永遠(yuǎn)留在安全集內(nèi)。
3.2 自碰撞避免約束(SCA)
作者保守地定義了自碰撞可行性(Definition 2):如果從當(dāng)前狀態(tài)出發(fā),以最大減速反向制動(dòng)至完全停止的整條制動(dòng)軌跡上都不發(fā)生自碰撞,則認(rèn)為該狀態(tài)是自碰撞安全的。
為學(xué)習(xí)這個(gè)可行集,作者使用了一個(gè)基于 Transformer 的神經(jīng)網(wǎng)絡(luò)分類器 Γ(q, q?)。訓(xùn)練數(shù)據(jù)通過仿真生成:采樣 300 萬組 (q, q?) 狀態(tài)對,模擬制動(dòng)過程并標(biāo)注 —— 若制動(dòng)軌跡無自碰撞則標(biāo)為 viable,否則標(biāo)為 non-viable。網(wǎng)絡(luò)采用標(biāo)準(zhǔn) Transformer-Encoder 架構(gòu)(前饋維度 128、2 個(gè)注意力頭、4 層堆疊),訓(xùn)練 30 個(gè) epoch,測試集準(zhǔn)確率達(dá) 99.27%,召回率達(dá) 99.74%。

圖 3:自碰撞可行性數(shù)據(jù)生成。從狀態(tài) (q?, q??) 出發(fā)執(zhí)行制動(dòng)直至靜止 (q?, 0):若整條軌跡無自碰撞,標(biāo)記為 Safe;否則標(biāo)記為 Self-Collide。
約束的實(shí)施通過 Taylor 展開將 ΔΓ(q, q?) ≥ 0 線性化為關(guān)于 q?的仿射約束,再通過動(dòng)力學(xué)方程轉(zhuǎn)化為力矩約束。關(guān)鍵公式為:
g_se?M?1τ ≥ g_se?M?1(Cq? + G) ? b_s
其中 g_se 和 b_s 由邊界函數(shù) Γ 對 q 和 q? 的一階梯度與時(shí)間步長計(jì)算得到。
3.3 外部障礙物碰撞避免約束(ECA)
對于外部碰撞,作者采用 Bernstein 多項(xiàng)式表示的符號(hào)距離函數(shù)(SDF) 編碼每個(gè)機(jī)器人連桿的幾何。定義可行性保持 SDF 為制動(dòng)軌跡上的最小瞬時(shí) SDF:
S_v (p, q?, q??) = min_{t∈[0,T_br]} S (p, q (t))
類似地,通過 Taylor 展開得到關(guān)于 q?的仿射約束,并轉(zhuǎn)化為力矩約束。值得注意的是,該約束通過 Δp 項(xiàng)隱式地納入了障礙物速度信息,因此 VPP-TC 天然具備處理動(dòng)態(tài)障礙物的能力。
3.4 關(guān)節(jié)位置與速度限位約束
受 Del Prete (2018) 啟發(fā),作者通過解析推導(dǎo)獲得關(guān)節(jié)加速度的上下界 q?_lb 和 q?_ub,取位置可行性約束、速度約束和硬件加速度限制的交集,再通過動(dòng)力學(xué)方程轉(zhuǎn)化為力矩約束。
3.5 統(tǒng)一的 QP 控制框架
最終的控制框架將所有約束統(tǒng)一到一個(gè)二次規(guī)劃(QP)問題中:目標(biāo)函數(shù)最小化實(shí)際力矩與名義被動(dòng)控制器力矩的偏差,約束條件包括關(guān)節(jié)限位(始終激活)、自碰撞約束(靠近邊界時(shí)激活)、外部碰撞約束(靠近邊界時(shí)激活)和力矩硬件限制。外部碰撞約束通過松弛變量軟化以保證 QP 可行性。

圖 4:平面 3-DoF 示例。左:工作空間軌跡。右:在硬件限制 [?10, 10] rad/s2 下的可行加速度域。當(dāng)外部碰撞約束激活時(shí),允許的加速度域收縮。
四、實(shí)驗(yàn)結(jié)果
4.1 仿真實(shí)驗(yàn)
在 7 自由度 Franka Panda 機(jī)械臂上(PyBullet 仿真),作者設(shè)計(jì)了三組對比實(shí)驗(yàn):僅自碰撞避免(SCA)、僅外部碰撞避免(ECA)、以及全約束(ALL)。與基線 CPIC 的定量對比如下表:

表 1:CPIC 與 VPP-TC 在不同約束設(shè)置下的性能對比(5 次實(shí)驗(yàn)平均值)
VPP-TC 在所有設(shè)置下都顯著優(yōu)于 CPIC:控制頻率提升 1.4–2.4 倍,軌跡長度更短,軌跡抖動(dòng)降低了一個(gè)數(shù)量級(jí)以上(特別是在 ECA 和 ALL 場景下)。
4.2 真機(jī)實(shí)驗(yàn)
作者在 7-DoF Franka Panda 真機(jī)上驗(yàn)證了三個(gè)場景:
自碰撞避免(SCA):未啟用 SCA 時(shí),機(jī)械臂因自碰撞預(yù)警觸發(fā) Reflex Mode 停止運(yùn)動(dòng);啟用 SCA 后安全到達(dá)目標(biāo)。更換 UMI 夾爪后重訓(xùn)網(wǎng)絡(luò),控制器仍有效。
外部碰撞避免(ECA):面對靜態(tài)和動(dòng)態(tài)障礙物,機(jī)械臂在被外力推向障礙物時(shí)能抵抗運(yùn)動(dòng)并保持安全間距;動(dòng)態(tài)障礙物接近時(shí)主動(dòng)退避。在約 200Hz 的控制頻率下實(shí)現(xiàn)真正的全身碰撞避免。
綜合場景:遙操作按臺(tái)燈開關(guān)任務(wù) —— 僅提供粗略目標(biāo)位置,無預(yù)計(jì)算的避障軌跡。VPP-TC 同時(shí)處理外部碰撞(臺(tái)燈燈體)和自碰撞約束,安全完成任務(wù)。

圖 5:真機(jī)實(shí)驗(yàn)。上排:自碰撞避免(a-c)。下排:外部碰撞避免(d-f)。軌跡疊加顯示約束激活后機(jī)械臂保持正向間距。

圖 6:遙操作任務(wù) —— 僅提供粗略目標(biāo)位置,VPP-TC 確保近燈安全并防止自碰撞,成功完成按燈開關(guān)任務(wù)。
五、技術(shù)亮點(diǎn)與討論
1. 無需二階導(dǎo)數(shù)。通過在 (q, q?) 增廣狀態(tài)空間中操作,安全約束被表達(dá)為關(guān)于加速度的仿射函數(shù),僅需要邊界函數(shù)的一階梯度。這大幅降低了計(jì)算負(fù)擔(dān),是實(shí)現(xiàn)高控制頻率的關(guān)鍵。
2. 統(tǒng)一框架處理多類約束。關(guān)節(jié)限位、自碰撞、外部碰撞三類約束在同一 QP 中統(tǒng)一處理,約束按需激活,框架簡潔優(yōu)雅。
3. 天然支持動(dòng)態(tài)障礙物。外部碰撞約束的 Taylor 展開中包含障礙物位移 Δp 項(xiàng),隱式編碼了障礙物速度,無需額外處理即可應(yīng)對動(dòng)態(tài)環(huán)境。
4. 全身碰撞避免。得益于 Bernstein 多項(xiàng)式 SDF 的高效計(jì)算,VPP-TC 能考慮所有機(jī)器人連桿的幾何,而非像 CPIC 那樣僅考慮末端幾個(gè)連桿。
5. 被動(dòng)性保證。論文在附錄中證明了即使在約束激活時(shí),控制器輸出的力矩仍保持任務(wù)空間被動(dòng)性 —— 約束反作用力要么被阻尼耗散,要么被約束反力吸收,不向環(huán)境注入凈能量。
未來方向:當(dāng)前框架假設(shè)精確的動(dòng)力學(xué)模型。作者計(jì)劃在未來工作中考慮有界的模型不確定性,設(shè)計(jì)在建模誤差下仍能保證可行性的魯棒控制器。
六、總結(jié)
VPP-TC 為被動(dòng)力矩控制的安全性問題提供了一套優(yōu)雅而高效的解決方案。它將可行性理論與數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)相結(jié)合,在增廣狀態(tài)空間中構(gòu)建安全集合,并通過 QP 實(shí)時(shí)求解力矩約束。這一框架在 IROS 2025 兩個(gè) Workshop 上分別獲得 Best Contribution Award 和 Best Student Paper Award,并被 ICRA 2026 錄用,充分體現(xiàn)了其學(xué)術(shù)價(jià)值和應(yīng)用潛力。對于關(guān)注人機(jī)交互安全、力矩控制以及機(jī)器人安全保障的研究者而言,這是一篇值得深入研讀的工作。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
本專題其他文章