0
| 本文作者: 陳淑瑜 | 2026-05-27 18:49 | 專題:ICRA 國際機(jī)器人與自動(dòng)化會(huì)議 |
來源:公眾號(hào)“l(fā)abren”
原文鏈接:https://mp.weixin.qq.com/s/97_CzzOnRfXvVUV_q30wKQ?scene=1
香港中文大學(xué)任洪亮教授團(tuán)隊(duì)論文《EndoDDC:通過擴(kuò)散深度補(bǔ)全學(xué)習(xí)稀疏到密集重建用于內(nèi)窺鏡機(jī)器人導(dǎo)航》被機(jī)器人領(lǐng)域頂會(huì) IEEE International Conference on Robotics and Automation (ICRA 2026) 錄用!

論文題目:EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion
論文作者:林胤恒?(香港中文大學(xué)),黃一鳴?(香港中文大學(xué)),崔貝雷(香港中文大學(xué)), 白龍(阿里巴巴達(dá)摩院,香港中文大學(xué)), 高滬昕(香港中文大學(xué)),任洪亮(香港中文大學(xué)), 賴捷文*(香港中文大學(xué))
論文簡(jiǎn)介:
在微創(chuàng)外科手術(shù)中,內(nèi)鏡機(jī)器人的精準(zhǔn)導(dǎo)航是提升手術(shù)精度、保障患者安全的核心。而精準(zhǔn)導(dǎo)航的關(guān)鍵,在于獲取可靠的三維深度信息 —— 但內(nèi)鏡環(huán)境下的弱紋理組織、鏡面反射等問題,一直讓深度估計(jì)成為技術(shù)難題?,F(xiàn)有方法要么依賴難以獲取的稠密標(biāo)注數(shù)據(jù),要么在復(fù)雜內(nèi)鏡場(chǎng)景中魯棒性不足,稀疏深度重建的有效性大打折扣。
我們提出的EndoDDC方法,為內(nèi)鏡機(jī)器人導(dǎo)航的深度估計(jì)難題提供了創(chuàng)新解決方案。該方法通過融合圖像、稀疏深度信息與深度梯度特征,借助擴(kuò)散模型優(yōu)化深度圖,成功攻克弱紋理、光反射帶來的技術(shù)痛點(diǎn)。
主要貢獻(xiàn):
EndoDDC針對(duì)內(nèi)鏡場(chǎng)景量身設(shè)計(jì)稀疏到稠密重建框架,有效解決傳統(tǒng)微調(diào)方法對(duì)標(biāo)注數(shù)據(jù)的依賴,以及自監(jiān)督學(xué)習(xí)的尺度模糊問題,僅通過 RGB 圖像和稀疏深度圖即可輸出精準(zhǔn)稠密深度圖。
創(chuàng)新引入深度梯度融合模塊,通過卷積門控循環(huán)單元(ConvGRU)迭代處理深度值與梯度信息,為重建過程提供精準(zhǔn)幾何引導(dǎo),大幅提升弱紋理區(qū)域的重建精度。
提出基于深度梯度的條件擴(kuò)散模型,以初始粗深度圖為起點(diǎn),利用深度梯度特征約束去噪過程,迭代優(yōu)化深度值,確保重建結(jié)果的全局一致性與物理合理性。
在 C3VD 和 StereoMIS 兩大公開內(nèi)鏡數(shù)據(jù)集上完成全面驗(yàn)證,所有評(píng)估指標(biāo)(RMSE、MAE、REL、δ 準(zhǔn)確率)均超越當(dāng)前 SOTA 方法。相較于最優(yōu)深度補(bǔ)全模型 OGNI-DC,C3VD 數(shù)據(jù)集上 RMSE 降低 5.28%、MAE 降低 7.84%;即使面對(duì) 50~50000 不同稀疏度的輸入,仍能穩(wěn)定輸出高質(zhì)量稠密深度圖。

EndoDDC方法概覽和可視化樣例

EndoDDC 概述:在從 RGB 圖像和稀疏深度圖提取特征后,Depth Grad Fusion 模塊會(huì)基于深度和梯度特征迭代地更新狀態(tài)隱藏網(wǎng)絡(luò)。然后,將該輸出輸入到 Depth Diffusion 模型進(jìn)行條件引導(dǎo)下的補(bǔ)全。

在 C3VD 和 STEREOMIS 數(shù)據(jù)集上與SOTA方法的深度補(bǔ)全結(jié)果比較。

在 C3VD 和 StereoMIS 數(shù)據(jù)集上的比較。我們將 EndoDDC 與最先進(jìn)的深度估計(jì)和深度補(bǔ)全方法進(jìn)行比較;我們的方法在組織細(xì)節(jié)方面產(chǎn)生的誤差更少。
參考文獻(xiàn):
Lin, Y., Huang, Y., Cui, B., Bai, L., Gao, H., Ren, H. & Lai, J. (2026). EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion. ICRA 2026.
本專題其他文章