ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

2026-06-01 15:10

導(dǎo)語：本文提出了 VPP-TC（Viability-Preserving Passive Torque Control）

原文作者：公眾號(hào)“機(jī)器之心”

原文鏈接：https://mp.weixin.qq.com/s/vPNP8686ZQ09KDzSMn-iaw

本篇文章被 ICRA 2026 接收并獲得 IROS 2025 雙料 Workshop 最佳論文，第一作者張子哲(site: zizhe.io)是賓夕法尼亞大學(xué)機(jī)器人學(xué)碩士生，同時(shí)在 GRASP 實(shí)驗(yàn)室擔(dān)任科研助理，導(dǎo)師為 Nadia Figueroa 教授，研究興趣涵蓋機(jī)器學(xué)習(xí)，安全控制以及人機(jī)交互。

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

論文標(biāo)題：Viability-Preserving Passive Torque Control

論文鏈接：https://arxiv.org/abs/2510.03367

項(xiàng)目主頁：https://vpp-tc.github.io/webpage/

一、一句話總結(jié)

本文提出了 VPP-TC（Viability-Preserving Passive Torque Control），一種基于可行性（viability）理論的被動(dòng)力矩控制框架。該框架在關(guān)節(jié)位置 - 速度的增廣狀態(tài)空間中預(yù)計(jì)算安全集合，將可行性約束轉(zhuǎn)化為關(guān)節(jié)加速度（進(jìn)而力矩）的仿射約束，通過二次規(guī)劃（QP）實(shí)時(shí)求解，確保機(jī)器人在無限時(shí)間范圍內(nèi)始終處于安全集合內(nèi)。相比基于控制屏障函數(shù)（CBF）的基線方法，VPP-TC 無需計(jì)算邊界函數(shù)的二階導(dǎo)數(shù)，控制回路頻率更高、軌跡更平滑、路徑更短。

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

圖 1：VPP-TC 控制框架示意圖。關(guān)節(jié)限位的力矩約束通過解析方法推導(dǎo)，自碰撞和外部碰撞約束通過數(shù)據(jù)驅(qū)動(dòng)方法學(xué)習(xí)。

二、研究背景與動(dòng)機(jī)

在物理人機(jī)交互（pHRI）場景中，機(jī)器人需要在與人類近距離協(xié)作時(shí)保持被動(dòng)性（passivity）—— 即吸收的能量不少于釋放的能量，從而保證在外部擾動(dòng)下的魯棒性和穩(wěn)定性。經(jīng)典的阻抗 / 導(dǎo)納控制框架、Port-Hamiltonian 方法以及基于動(dòng)力系統(tǒng)（DS）的被動(dòng)力矩控制器已被廣泛研究。

然而，這類被動(dòng)控制器通常缺乏顯式的約束處理能力，無法保證在整個(gè)任務(wù)執(zhí)行過程中的碰撞避免和關(guān)節(jié)限位滿足。先前工作 CPIC 利用控制屏障函數(shù)（CBF）框架和指數(shù)控制屏障函數(shù)（ECBF）來約束被動(dòng)力矩控制器，但存在以下問題：

硬約束之間可能互相沖突，導(dǎo)致 QP 不可行；
QP 框架易陷入死鎖和關(guān)節(jié)空間的局部最小值；
ECBF 需要計(jì)算邊界函數(shù)的 Hessian 矩陣（二階導(dǎo)數(shù)），當(dāng)邊界由神經(jīng)網(wǎng)絡(luò)表示時(shí)，實(shí)時(shí)性難以保證。

正是這些局限性，促使作者提出了基于可行性理論（viability theory）的全新安全控制框架。

三、方法詳解

3.1 核心思想：從 CBF 到 Viability

VPP-TC 的核心創(chuàng)新在于：在關(guān)節(jié)位置 q 和關(guān)節(jié)速度 q?的增廣狀態(tài)空間中引入安全邊界，而非僅在關(guān)節(jié)位置空間中。在這個(gè)增廣空間中操作的好處是，安全約束可以直接推導(dǎo)為關(guān)節(jié)加速度 q?的仿射約束，再通過機(jī)器人動(dòng)力學(xué)方程轉(zhuǎn)化為力矩約束 —— 整個(gè)過程無需計(jì)算邊界函數(shù)的二階導(dǎo)數(shù)。

可行性的定義（Definition 1）是：從可行集 V 中的任意初始狀態(tài)出發(fā)，存在一個(gè)控制序列（加速度序列），使得產(chǎn)生的無限長狀態(tài)序列始終在可行集內(nèi)。這比單純的「可行」（feasible）更強(qiáng) —— 一個(gè)可行狀態(tài)可能在未來的控制下離開可行集，但一個(gè) viable 狀態(tài)保證能永遠(yuǎn)留在安全集內(nèi)。

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

圖 2：可行性（viability）概念。狀態(tài) s1 既可行又 viable，而 s2 可行但不 viable—— 雖然當(dāng)前滿足約束，但不存在一個(gè)控制序列能保證它永遠(yuǎn)留在安全集內(nèi)。

3.2 自碰撞避免約束（SCA）

作者保守地定義了自碰撞可行性（Definition 2）：如果從當(dāng)前狀態(tài)出發(fā)，以最大減速反向制動(dòng)至完全停止的整條制動(dòng)軌跡上都不發(fā)生自碰撞，則認(rèn)為該狀態(tài)是自碰撞安全的。

為學(xué)習(xí)這個(gè)可行集，作者使用了一個(gè)基于 Transformer 的神經(jīng)網(wǎng)絡(luò)分類器 Γ(q, q?)。訓(xùn)練數(shù)據(jù)通過仿真生成：采樣 300 萬組 (q, q?) 狀態(tài)對，模擬制動(dòng)過程并標(biāo)注 —— 若制動(dòng)軌跡無自碰撞則標(biāo)為 viable，否則標(biāo)為 non-viable。網(wǎng)絡(luò)采用標(biāo)準(zhǔn) Transformer-Encoder 架構(gòu)（前饋維度 128、2 個(gè)注意力頭、4 層堆疊），訓(xùn)練 30 個(gè) epoch，測試集準(zhǔn)確率達(dá) 99.27%，召回率達(dá) 99.74%。

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

圖 3：自碰撞可行性數(shù)據(jù)生成。從狀態(tài) (q?, q??) 出發(fā)執(zhí)行制動(dòng)直至靜止 (q?, 0)：若整條軌跡無自碰撞，標(biāo)記為 Safe；否則標(biāo)記為 Self-Collide。

約束的實(shí)施通過 Taylor 展開將 ΔΓ(q, q?) ≥ 0 線性化為關(guān)于 q?的仿射約束，再通過動(dòng)力學(xué)方程轉(zhuǎn)化為力矩約束。關(guān)鍵公式為：

g_se?M?1τ ≥ g_se?M?1(Cq? + G) ? b_s

其中 g_se 和 b_s 由邊界函數(shù) Γ 對 q 和 q? 的一階梯度與時(shí)間步長計(jì)算得到。

3.3 外部障礙物碰撞避免約束（ECA）

對于外部碰撞，作者采用 Bernstein 多項(xiàng)式表示的符號(hào)距離函數(shù)（SDF）編碼每個(gè)機(jī)器人連桿的幾何。定義可行性保持 SDF 為制動(dòng)軌跡上的最小瞬時(shí) SDF：

S_v (p, q?, q??) = min_{t∈[0,T_br]} S (p, q (t))

類似地，通過 Taylor 展開得到關(guān)于 q?的仿射約束，并轉(zhuǎn)化為力矩約束。值得注意的是，該約束通過 Δp 項(xiàng)隱式地納入了障礙物速度信息，因此 VPP-TC 天然具備處理動(dòng)態(tài)障礙物的能力。

3.4 關(guān)節(jié)位置與速度限位約束

受 Del Prete (2018) 啟發(fā)，作者通過解析推導(dǎo)獲得關(guān)節(jié)加速度的上下界 q?_lb 和 q?_ub，取位置可行性約束、速度約束和硬件加速度限制的交集，再通過動(dòng)力學(xué)方程轉(zhuǎn)化為力矩約束。

3.5 統(tǒng)一的 QP 控制框架

最終的控制框架將所有約束統(tǒng)一到一個(gè)二次規(guī)劃（QP）問題中：目標(biāo)函數(shù)最小化實(shí)際力矩與名義被動(dòng)控制器力矩的偏差，約束條件包括關(guān)節(jié)限位（始終激活）、自碰撞約束（靠近邊界時(shí)激活）、外部碰撞約束（靠近邊界時(shí)激活）和力矩硬件限制。外部碰撞約束通過松弛變量軟化以保證 QP 可行性。

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

圖 4：平面 3-DoF 示例。左：工作空間軌跡。右：在硬件限制 [?10, 10] rad/s2 下的可行加速度域。當(dāng)外部碰撞約束激活時(shí)，允許的加速度域收縮。

四、實(shí)驗(yàn)結(jié)果

4.1 仿真實(shí)驗(yàn)

在 7 自由度 Franka Panda 機(jī)械臂上（PyBullet 仿真），作者設(shè)計(jì)了三組對比實(shí)驗(yàn)：僅自碰撞避免（SCA）、僅外部碰撞避免（ECA）、以及全約束（ALL）。與基線 CPIC 的定量對比如下表：

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

表 1：CPIC 與 VPP-TC 在不同約束設(shè)置下的性能對比（5 次實(shí)驗(yàn)平均值）

VPP-TC 在所有設(shè)置下都顯著優(yōu)于 CPIC：控制頻率提升 1.4–2.4 倍，軌跡長度更短，軌跡抖動(dòng)降低了一個(gè)數(shù)量級(jí)以上（特別是在 ECA 和 ALL 場景下）。

4.2 真機(jī)實(shí)驗(yàn)

作者在 7-DoF Franka Panda 真機(jī)上驗(yàn)證了三個(gè)場景：

自碰撞避免（SCA）：未啟用 SCA 時(shí)，機(jī)械臂因自碰撞預(yù)警觸發(fā) Reflex Mode 停止運(yùn)動(dòng)；啟用 SCA 后安全到達(dá)目標(biāo)。更換 UMI 夾爪后重訓(xùn)網(wǎng)絡(luò)，控制器仍有效。
外部碰撞避免（ECA）：面對靜態(tài)和動(dòng)態(tài)障礙物，機(jī)械臂在被外力推向障礙物時(shí)能抵抗運(yùn)動(dòng)并保持安全間距；動(dòng)態(tài)障礙物接近時(shí)主動(dòng)退避。在約 200Hz 的控制頻率下實(shí)現(xiàn)真正的全身碰撞避免。
綜合場景：遙操作按臺(tái)燈開關(guān)任務(wù) —— 僅提供粗略目標(biāo)位置，無預(yù)計(jì)算的避障軌跡。VPP-TC 同時(shí)處理外部碰撞（臺(tái)燈燈體）和自碰撞約束，安全完成任務(wù)。

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

圖 5：真機(jī)實(shí)驗(yàn)。上排：自碰撞避免（a-c）。下排：外部碰撞避免（d-f）。軌跡疊加顯示約束激活后機(jī)械臂保持正向間距。

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

圖 6：遙操作任務(wù) —— 僅提供粗略目標(biāo)位置，VPP-TC 確保近燈安全并防止自碰撞，成功完成按燈開關(guān)任務(wù)。

五、技術(shù)亮點(diǎn)與討論

1. 無需二階導(dǎo)數(shù)。通過在 (q, q?) 增廣狀態(tài)空間中操作，安全約束被表達(dá)為關(guān)于加速度的仿射函數(shù)，僅需要邊界函數(shù)的一階梯度。這大幅降低了計(jì)算負(fù)擔(dān)，是實(shí)現(xiàn)高控制頻率的關(guān)鍵。

2. 統(tǒng)一框架處理多類約束。關(guān)節(jié)限位、自碰撞、外部碰撞三類約束在同一 QP 中統(tǒng)一處理，約束按需激活，框架簡潔優(yōu)雅。

3. 天然支持動(dòng)態(tài)障礙物。外部碰撞約束的 Taylor 展開中包含障礙物位移 Δp 項(xiàng)，隱式編碼了障礙物速度，無需額外處理即可應(yīng)對動(dòng)態(tài)環(huán)境。

4. 全身碰撞避免。得益于 Bernstein 多項(xiàng)式 SDF 的高效計(jì)算，VPP-TC 能考慮所有機(jī)器人連桿的幾何，而非像 CPIC 那樣僅考慮末端幾個(gè)連桿。

5. 被動(dòng)性保證。論文在附錄中證明了即使在約束激活時(shí)，控制器輸出的力矩仍保持任務(wù)空間被動(dòng)性 —— 約束反作用力要么被阻尼耗散，要么被約束反力吸收，不向環(huán)境注入凈能量。

未來方向：當(dāng)前框架假設(shè)精確的動(dòng)力學(xué)模型。作者計(jì)劃在未來工作中考慮有界的模型不確定性，設(shè)計(jì)在建模誤差下仍能保證可行性的魯棒控制器。

六、總結(jié)

VPP-TC 為被動(dòng)力矩控制的安全性問題提供了一套優(yōu)雅而高效的解決方案。它將可行性理論與數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)相結(jié)合，在增廣狀態(tài)空間中構(gòu)建安全集合，并通過 QP 實(shí)時(shí)求解力矩約束。這一框架在 IROS 2025 兩個(gè) Workshop 上分別獲得 Best Contribution Award 和 Best Student Paper Award，并被 ICRA 2026 錄用，充分體現(xiàn)了其學(xué)術(shù)價(jià)值和應(yīng)用潛力。對于關(guān)注人機(jī)交互安全、力矩控制以及機(jī)器人安全保障的研究者而言，這是一篇值得深入研讀的工作。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))

0人收藏

相關(guān)文章

ICRA2026頂會(huì)賽事 | REAL-I具身智能挑戰(zhàn)賽現(xiàn)場賽來襲 ...

專題

ICRA 國際機(jī)器人與自動(dòng)化會(huì)議

本專題其他文章

吳思?jí)?/span>

編輯

發(fā)私信

當(dāng)月熱門文章

97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

ICRA 2026 | VPP-TC: 基于可行性理論的被動(dòng)力矩安全控制框架

ICRA 國際機(jī)器人與自動(dòng)化會(huì)議