0
| 本文作者: 陳淑瑜 | 2026-06-04 14:43 | 專題:CVPR 計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議 |
CVPR 2026丹佛會(huì)期進(jìn)入第三天,三大趨勢(shì)浮出水面:無(wú)監(jiān)督視覺(jué)表征打破光流SOTA、視覺(jué)語(yǔ)言導(dǎo)航首次進(jìn)入自動(dòng)駕駛、具身智能論文量暴增全面屠榜。本期日?qǐng)?bào)精選三個(gè)最熱方向,帶你一文看盡今日CVPR高光時(shí)刻。
以下為本日社區(qū)關(guān)注度最高的三個(gè)核心議題,按熱度排序,均附論文摘要與原文鏈接,方便快速研判與選題跟進(jìn)。
熱門議題一:無(wú)監(jiān)督光流首獲Oral,U2Flow KITTI封神
當(dāng)監(jiān)督學(xué)習(xí)還在為標(biāo)注成本發(fā)愁,中山大學(xué)團(tuán)隊(duì)用純無(wú)監(jiān)督方式直接刷新光流SOTA。Oral論文+開(kāi)源代碼+KITTI登頂——這個(gè)組合讓整個(gè)社區(qū)為之一振。
論文:U2Flow: 首個(gè)遞歸無(wú)監(jiān)督光流框架
來(lái)源:我愛(ài)計(jì)算機(jī)視覺(jué)
日期:2026-06-03
分級(jí):S級(jí)(Oral論文)
論文摘要
中山大學(xué)(聯(lián)合華中科技大學(xué))提出U2Flow,首個(gè)將遞歸結(jié)構(gòu)與不確定性估計(jì)結(jié)合的無(wú)監(jiān)督光流框架。核心創(chuàng)新:①不確定性估計(jì)頭在遞歸更新塊內(nèi)預(yù)測(cè)像素級(jí)不確定性;②增強(qiáng)一致性無(wú)監(jiān)督學(xué)習(xí)策略,利用數(shù)據(jù)增強(qiáng)訓(xùn)練模型自我評(píng)估預(yù)測(cè)質(zhì)量;③解耦學(xué)習(xí)策略保證聯(lián)合訓(xùn)練穩(wěn)定性。性能:KITTI-2015 Fl-all 6.00%(超越所有無(wú)監(jiān)督SOTA),參數(shù)量?jī)H5.22M,RTX 3090上15 FPS。已開(kāi)源:github.com/sunzunyi/U2FLOW
原文鏈接: https://mp.weixin.qq.com/s/KmQn73epN6nGJP9XQJqUOw
熱門議題二:VLN殺入自動(dòng)駕駛,DriveVLN不帶地圖也精準(zhǔn)停車
不需要高精地圖,靠一句自然語(yǔ)言指令就能把車開(kāi)進(jìn)地下停車位——澳門大學(xué)與千里科技聯(lián)手,讓視覺(jué)語(yǔ)言導(dǎo)航從室內(nèi)走向真實(shí)道路,98.61%的準(zhǔn)確率直接把GPT-5甩在身后。
論文:DriveVLN: 無(wú)地圖自動(dòng)駕駛視覺(jué)語(yǔ)言導(dǎo)航
來(lái)源:CVer
日期:2026-06-03
分級(jí):A級(jí)(范式突破)
論文摘要
澳門大學(xué)智慧城市物聯(lián)網(wǎng)國(guó)家重點(diǎn)實(shí)驗(yàn)室聯(lián)合千里科技(Afari)提出DriveVLN,將視覺(jué)語(yǔ)言導(dǎo)航從室內(nèi)機(jī)器人遷移至自動(dòng)駕駛。創(chuàng)新:雙分支架構(gòu)——DiffusionDrive擴(kuò)散模型規(guī)劃器生成候選軌跡 + 微調(diào)Qwen2.5-VL-3B多模態(tài)選擇器基于目的地指令選最優(yōu)路徑。兩階段訓(xùn)練:SFT+GRPO強(qiáng)化學(xué)習(xí)。實(shí)測(cè):地下停車場(chǎng)車位到達(dá)準(zhǔn)確率98.61%,大幅超越GPT-5(81.89%)。論文已發(fā)布于CVPR Open Access。
原文鏈接: https://mp.weixin.qq.com/s/dvL8H5uIo-uV8WJ3yEDNiQ
熱門議題三:具身智能屠榜CVPR,VLA論文量暴增成新王
從Detection到Embodied,CVPR的年度關(guān)鍵詞正在發(fā)生質(zhì)變。VLA論文暴增、機(jī)器人操作成為最熱方向、Sim2Real從加分項(xiàng)變剛需——具身智能正在重新定義計(jì)算機(jī)視覺(jué)的邊界。
分析來(lái)源:CVer(定性研判)
日期:2026-06-03
熱度:?持續(xù)高熱(社區(qū)級(jí)共識(shí))
核心觀點(diǎn)
CVer定性指出VLA論文數(shù)量暴增、機(jī)器人操作成熱點(diǎn)、Sim2Real成為剛需,關(guān)鍵詞從傳統(tǒng)的Detection/Segmentation轉(zhuǎn)向Embodied/Policy/Interaction。多位CVer推文證實(shí)具身智能為CVPR 2026最熱門方向,VLA論文量持續(xù)增長(zhǎng)。此外,機(jī)器之心將于6月7日在丹佛現(xiàn)場(chǎng)舉辦"具身智能與物理世界"專場(chǎng)直播,進(jìn)一步印證這一趨勢(shì)。
查看全文: https://mp.weixin.qq.com/s/TBvjugVHaRrUpWbpYJqY0w
機(jī)器之心直播: https://mp.weixin.qq.com/s/aeck-p3ka9fSugiZsiL17Q
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
關(guān)注本專區(qū),每日追蹤C(jī)VPR 2026最新論文與熱點(diǎn)趨勢(shì)
更多CVPR現(xiàn)場(chǎng)快訊、深度解讀與選題建議,每日準(zhǔn)時(shí)送達(dá)。 收藏關(guān)注,不錯(cuò)過(guò)任何一篇值得讀的論文。
內(nèi)容由AI輔助生成,請(qǐng)謹(jǐn)慎參考 | CVPR 2026 Hot Daily
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專題其他文章