97情色五月天,人妻的色诱伦理片,曰韩AV久久AV,99视频在线播放,久久国产黄色电影,999美女激情,婷婷AV一区二区三区,久草精品视频网站,操青青在线观看

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給陳淑瑜
發(fā)送

0

UniMMAD——大工&南洋理工提出統(tǒng)一多模態(tài)異常檢測(cè),59 FPS刷新推理效率150倍 | CVPR 2026

導(dǎo)語:能否構(gòu)建一個(gè)通用的"大腦",既能理解多模態(tài)融合信息,又能針對(duì)不同任務(wù)動(dòng)態(tài)調(diào)用"專家知識(shí)"?

【封面圖片來源:網(wǎng)站名微信公眾號(hào),所有者:極市平臺(tái)】

一、背景 

工業(yè)質(zhì)檢和醫(yī)療影像分析中,傳統(tǒng)方法采用"一個(gè)任務(wù)一個(gè)模型"的碎片化模式,檢測(cè)不同模態(tài)(如RGB、紅外、3D深度)需要部署多個(gè)專用模型,導(dǎo)致運(yùn)維成本高、泛化能力差?,F(xiàn)有方法存在域干擾問題——直接融合多域特征會(huì)引入噪聲,導(dǎo)致大量誤報(bào)。

能否構(gòu)建一個(gè)通用的"大腦",既能理解多模態(tài)融合信息,又能針對(duì)不同任務(wù)動(dòng)態(tài)調(diào)用"專家知識(shí)"?這一問題的解決對(duì)于工業(yè)質(zhì)檢和醫(yī)療影像的智能化升級(jí)具有重大意義。

來自大連理工大學(xué)、工源三仟、南洋理工大學(xué)的科研團(tuán)隊(duì)共同提出了一種名為 UniMMAD 的統(tǒng)一框架。該模型被命名為 UniMMAD,意為“Unified Multi-Modal and Multi-Class Anomaly Detection”,即統(tǒng)一的多模態(tài)、多類別異常檢測(cè),采用"通用-特定"范式,通過壓縮-解壓架構(gòu)實(shí)現(xiàn)統(tǒng)一的多模態(tài)、多類別異常檢測(cè),大幅提升模型泛化能力和部署效率。它最令人驚艷的地方在于,僅用一套參數(shù),就能同時(shí)處理涵蓋工業(yè)、醫(yī)療、合成數(shù)據(jù)等 3 個(gè)領(lǐng)域、12 種模態(tài)和 66 個(gè)類別的異常檢測(cè)任務(wù)。

UniMMAD——大工&南洋理工提出統(tǒng)一多模態(tài)異常檢測(cè),59 FPS刷新推理效率150倍  |  CVPR 2026

 二、核心方法 

UniMMAD 采用通用-特定范式,通過三大核心模塊實(shí)現(xiàn)多模態(tài)異常檢測(cè)的統(tǒng)一。

通用多模態(tài)編碼器(特征壓縮模塊FCM):

通過多尺度BottleNeck結(jié)構(gòu),將任意組合的輸入(如RGB+Depth)壓縮成緊湊的通用特征。內(nèi)部多尺度瓶頸利用不同尺度的并行卷積捕捉正常模式,外部語義瓶頸在更高語義層級(jí)進(jìn)行精細(xì)壓縮,剔除異常激活,輸出純凈的通用特征表示。

跨條件混合專家(C-MoE):

引入"領(lǐng)域先驗(yàn)"作為導(dǎo)航,動(dòng)態(tài)選擇專家路徑。采用MoE-in-MoE結(jié)構(gòu),將參數(shù)量減少約75%,同時(shí)保持專家組合的靈活性。條件路由器根據(jù)輸入的模態(tài)和類別信息,動(dòng)態(tài)選擇最合適的專家路徑,實(shí)現(xiàn)精準(zhǔn)的任務(wù)適配。

分組動(dòng)態(tài)濾波(GDF):

將多個(gè)專家計(jì)算合并為單組卷積,提升并行效率。配合解壓一致性損失保證解壓過程與壓縮過程的一致性,確保恢復(fù)的圖像與原始輸入在語義上保持對(duì)齊。

UniMMAD——大工&南洋理工提出統(tǒng)一多模態(tài)異常檢測(cè),59 FPS刷新推理效率150倍  |  CVPR 2026

三、亮點(diǎn)總結(jié)  

創(chuàng)新點(diǎn)一:MVTec-3D 圖像級(jí)AUC 92.527

在MVTec-3D數(shù)據(jù)集上,UniMMAD圖像級(jí)AUC達(dá)到92.527,像素級(jí)AUC達(dá)到99.089,在BraTs醫(yī)療數(shù)據(jù)集上同樣超越專用醫(yī)療模型,全面驗(yàn)證了統(tǒng)一框架在多模態(tài)、多類別異常檢測(cè)任務(wù)上的領(lǐng)先性能。

創(chuàng)新點(diǎn)二:59.09 FPS,推理速度提升150倍

相比多模態(tài)方法M3DM的0.39 FPS,UniMMAD達(dá)到59.09 FPS,實(shí)現(xiàn)約150倍的速度提升。參數(shù)減少75%的同時(shí)保持高精度,滿足工業(yè)實(shí)時(shí)部署的嚴(yán)苛需求。

創(chuàng)新點(diǎn)三:持續(xù)學(xué)習(xí)能力

UniMMAD展現(xiàn)出優(yōu)秀的持續(xù)學(xué)習(xí)能力——學(xué)習(xí)新任務(wù)后,舊任務(wù)性能下降不到8%,有效解決了"災(zāi)難性遺忘"問題。域干擾問題也得到有效解決:不同領(lǐng)域(紅外、3D等)激活不同專家路徑,避免了噪聲干擾,提升了異常檢測(cè)的準(zhǔn)確性。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

──────────────────────────────────────────

上述內(nèi)容包含AI輔助生成,更詳細(xì)信息參見兩個(gè)鏈接

論文鏈接:https://arxiv.org/abs/2509.25934

解讀來源:https://mp.weixin.qq.com/s/rIRlMmhkgqHj0wq6ob0NCw


UniMMAD——大工&南洋理工提出統(tǒng)一多模態(tài)異常檢測(cè),59 FPS刷新推理效率150倍  |  CVPR 2026

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說
满城县| 博罗县| 锡林浩特市| 开化县| 屏边| 宝鸡市| 阳山县| 珲春市| 泗水县| 文成县| 恩施市| 青海省| 林甸县| 塔河县| 翼城县| 新河县| 双桥区| 义乌市| 新干县| 志丹县| 连城县| 城固县| 盐城市| 南通市| 连城县| 青田县| 巴马| 剑川县| 铜川市| 托克逊县| 昭通市| 时尚| 黎平县| 舒兰市| 梅河口市| 滁州市| 聂荣县| 海城市| 高唐县| 济南市| 于田县|