明天開幕！浙大螞蟻Oral候選+一人雙Highlight，CVPR前夜終極大爆發(fā)

本文作者：陳淑瑜

2026-06-02 15:37

導語：開幕前夜終爆：Oral候選+一人雙Highlight+4D重建

距CVPR 2026正式開幕（6月3日）僅剩最后一天，本期是臨會前最后一期日報——信息密度拉滿。

三大核心信號同時亮起：浙大與螞蟻聯(lián)合團隊的HTD-Refine確認Oral + Best Paper Candidate雙重身份，高階動力學對齊徹底終結(jié)單目人體動作恢復(fù)的"滑步+抖動"，成為中國團隊本屆最強成績；密歇根大學Nikhil Behari一人獨攬兩篇Highlight——DENALI（低功耗LiDAR非視距推理數(shù)據(jù)集）與Task-Driven Implicit（LiDAR系統(tǒng)自動化設(shè)計），同一作者雙Highlight在CVPR極為罕見；PackUV以85贊拿下本期最高互動，前饋4D重建的體素化全量視頻表示繼續(xù)為3D方向續(xù)火。

以下三大議題，帶你在開幕前夜完成最后一輪火力校準。

熱門議題一：浙大&螞蟻Oral候選確認！Best Paper Candidate雙重認證，中國團隊本屆最強信號

單目視頻的人體動作恢復(fù)長期被"滑步"和"抖動"兩大頑疾困擾，直接制約了數(shù)字人、虛擬試衣和康復(fù)醫(yī)學的落地。HTD-Refine從高階時序動力學入手，直接對齊速度和加速度而非傳統(tǒng)位置對齊，在機制層面根治了這一痛點。更關(guān)鍵的是，它同時拿下Oral和Best Paper Candidate——這種雙重認證在CVPR數(shù)千篇投稿中鳳毛麟角，也是螞蟻集團與浙大產(chǎn)學研合作的標桿性成果。國內(nèi)媒體「我愛計算機視覺」和「AI前沿速遞」同日報道，快訊價值已經(jīng)就位。

HTD-Refine: High-order Temporal Dynamics Refinement for Monocular Human Motion Recovery（CVPR 2026 Oral & Best Paper Candidate）

浙江大學與螞蟻集團聯(lián)合提出HTD-Refine，針對單目視頻人體動作恢復(fù)中長期存在的"滑步"（foot skating）和"抖動"（jittering）問題，創(chuàng)新性地引入高階時序動力學對齊——直接對齊速度和加速度而非傳統(tǒng)的位置對齊，從根本上提升了動作恢復(fù)的自然度與時序穩(wěn)定性。論文同時獲得CVPR 2026 Oral認定和Best Paper Candidate（最佳論文候選）資格，是本屆會議中國團隊的最強成果，在動作捕捉、數(shù)字人生成及康復(fù)醫(yī)學等產(chǎn)業(yè)方向具有極高應(yīng)用價值。

論文/原文鏈接：https://mp.weixin.qq.com/s/zw_R86_cL48P-IEwE3PJfw

熱門議題二：一人雙Highlight！密歇根Nikhil Behari獨攬LiDAR感知兩席，非視距推理×自動化設(shè)計雙突破

在CVPR 2026數(shù)千篇投稿中，同一位作者同時拿下兩篇Highlight的概率極低——密歇根大學的Nikhil Behari做到了。DENALI構(gòu)建了首個低功耗LiDAR非視距空間推理數(shù)據(jù)集，把NLOS從"燒錢的高功率設(shè)備"拉到低成本LiDAR即可運行的現(xiàn)實層面；Task-Driven Implicit Representations則從系統(tǒng)設(shè)計角度出發(fā)，用隱式表示自動化LiDAR感知管線的構(gòu)建流程。兩篇論文一"數(shù)據(jù)"一"系統(tǒng)"，共同將LiDAR感知方向推向了工程化臨界點。40贊/4.9K views的互動也印證了社區(qū)對這一方向的高度關(guān)注。

DENALI: Low-Power LiDAR Non-Line-of-Sight Spatial Reasoning Dataset（CVPR 2026 Highlight）

密歇根大學Nikhil Behari提出DENALI，首個面向低功耗LiDAR的非視距（Non-Line-of-Sight）空間推理大規(guī)模數(shù)據(jù)集。該數(shù)據(jù)集將NLOS感知從依賴昂貴高功率設(shè)備的實驗室場景，拓展至低成本LiDAR即可部署的現(xiàn)實應(yīng)用，標志著NLOS感知從學術(shù)概念走向工程化的關(guān)鍵拐點。獲CVPR 2026 Highlight認定。

論文/原文鏈接：https://x.com/NikhilBehari/status/2061078776595775760

Task-Driven Implicit Representations for Automated LiDAR System Design（CVPR 2026 Highlight）

Nikhil Behari同期另一篇Highlight論文，提出任務(wù)驅(qū)動的隱式表示方法，實現(xiàn)LiDAR感知系統(tǒng)的自動化設(shè)計。與DENALI形成"數(shù)據(jù)基建+系統(tǒng)自動化"的協(xié)同突破，兩篇Highlight共同將LiDAR感知方向推向工程化部署階段。

論文/原文鏈接：https://x.com/NikhilBehari/status/2061078776595775760

熱門議題三：85贊最高互動！PackUV前饋4D重建續(xù)火，RLFTSim Highlight為自動駕駛仿真開新路

本期推文互動王屬于PackUV——85贊/5.2K views，在臨會期"I'm heading to CVPR"刷屏的背景下尤為突出。PackUV用體素化全量視頻表示實現(xiàn)前饋4D重建，延續(xù)了3D/4D方向在本屆CVPR的持續(xù)高熱度。與此同時，RLFTSim以Highlight身份為自動駕駛仿真開辟新范式——用強化學習微調(diào)生成真實可控的多智能體交通場景，直接服務(wù)于自動駕駛訓練的數(shù)據(jù)瓶頸問題。一"重建"一"仿真"，3D視覺與自動駕駛在本期形成了明確的交叉共振。

PackUV: Feed-Forward 4D Reconstruction with Volumetric Video Representation

Anushka Agarwal提出PackUV，一種面向4D視覺的前饋重建方法，支持全量視頻的體素化表示。以85贊/5.2K views成為本期最高互動推文，在feed-forward 4D重建方向延續(xù)了3D/4D Gaussian Splatting在本屆CVPR的持續(xù)高熱度，為動態(tài)場景的高效重建提供了新的技術(shù)路線。

論文/原文鏈接：https://x.com/_anushkaagarwal/status/2060874508962050220

RLFTSim: Reinforcement Learning Fine-Tuned Simulation for Multi-Agent Traffic（CVPR 2026 Highlight）

Ehsan Ahmadi等人提出RLFTSim，通過強化學習微調(diào)生成真實可控的多智能體交通仿真場景，獲CVPR 2026 Highlight認定。該方法直接服務(wù)于自動駕駛訓練中的數(shù)據(jù)瓶頸問題——傳統(tǒng)仿真器生成的數(shù)據(jù)往往缺乏真實感和可控性，RL微調(diào)后的仿真在保真度和可控性上實現(xiàn)了顯著提升。

論文/原文鏈接：https://x.com/ehsana94/status/2061499006539219351

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

更多CVPR 2026深度資訊，歡迎關(guān)注【CVPR 2026專區(qū)】明日（6/3）CVPR 2026正式開幕，我們將切換會中實時模式：

·Best Paper Award 第一時間追蹤 · Keynote 核心觀點速遞 · 中國機構(gòu) / 中國廠商現(xiàn)場直擊 · Oral & Highlight 論文現(xiàn)場速讀 · Side Event & Workshop 亮點集錦

每日一報，不漏一篇——陪你全程鎖定視覺智能最前沿。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。