24頁綜述,共計172篇參考文獻!據作者稱,這是第一個對基於深度學習的單目物體姿態檢測和跟蹤進行全面調研的工作,涵蓋了最新方法、任務定義、度量定義、資料集。聚焦於以RGB/ RGBD資料為輸入。

注1:文末附【視覺Transformer】交流群

注2:整理不易,歡迎點贊,支援分享!

想看更多CVPR 2021論文和開源專案可以點選:

Deep Learning on Monocular Object Pose Detection and Tracking: A Comprehensive Overview

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

作者單位:中國人民大學, 清華大學, 北京交通大學

論文:

https://

arxiv。org/abs/2105。1429

1

由於其在自動駕駛、機器人和增強現實等許多領域的廣泛應用,物體姿態檢測和跟蹤最近引起了越來越多的關注。在物體姿態檢測和跟蹤的方法中,深度學習是最有前途的一種,其效能優於其他方法。然而,缺乏對基於深度學習的方法的最新發展的調查研究。

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

因此,本文對屬於深度學習技術路線的物體姿態檢測和跟蹤的最新進展進行了全面回顧。

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

為了更深入地介紹,本文的範圍僅限於以單目 RGB/RGBD 資料為輸入的方法,涵蓋三種主要任務:

例項級單目物體姿態檢測、類別級單目物體姿態檢測、單目物體姿態跟蹤

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

在我們的工作中,詳細介紹了有關檢測和跟蹤的指標、資料集和方法。

單目物體姿態檢測和跟蹤資料集:

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

方法:

RGB-based instance level monocular object pose detection methods

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

(RGB)D-based instance level monocular object pose detection methods

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

category level monocular 3D object detection methods

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

category level monocular 6D pose detection methods

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

monocular object pose tracking

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

還介紹了當前最先進方法在幾個公開可用資料集上的比較結果,以及富有洞察力的觀察和鼓舞人心的未來研究方向。

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

主要貢獻:

最新CV綜述!單目物體姿態檢測和跟蹤的深度學習技術:全面調研

CVer-視覺Transformer交流群

建了CVer-Transformer交流群!想要進Transformer學習交流群的同學,可以直接加微訊號:

CVer9999

。加的時候備註一下:

Transformer+學校+暱稱

,即可。然後就可以拉你進群了。

強烈推薦大家關注

CVer知乎

賬號和

CVer

微信公眾號,可以快速瞭解到最新優質的CV論文。

推薦閱讀

阿里提出KVT:提升視覺Transformer的 k-NN 注意力

華中科大提出YOLOS:透過目標檢測重新思考視覺Transformer

Transformer再下一城!StyTr^2:首個基於Transformer的影象風格遷移

CNN+Transformer新組合!北航/北大/百度提出DS-Net:用於視覺識別的雙流網路

SegFormer:使用Transformer進行語義分割的簡單高效設計

南京大學提出ResT:用於視覺識別的高效Transformer

CNN視覺化又添新作!南大提出Group-CAM:高效的顯著圖生成方法

新垣結衣夫婦的孩子會長啥樣?我用BabyGAN預測試試。。。

谷歌提出NesT:聚合巢狀Transformer

寫給新手煉丹師:2021版調參上分手冊

新坑來了!谷歌提出MLP-Mixer:一種用於視覺的全MLP架構

計算機視覺頂尖期刊和會議的段子