最近Facebook提出了DETR,以消除物体检测中对许多手工设计组件的需求,同时表现出良好的性能。但是,由于Transformer注意模块在处理图像特征图时的局限性,因此收敛速度慢且特征空间分辨率有限。为了缓解这些问题,商汤科技研究院研究执行总监、智源青年科学家代季峰团队提出了可变形DETR,其关注模块仅关注参考周围的一小部分关键采样点。可变形的DETR可以获得比DETR更好的性能(尤其是在小物体上),训练时间减少了10倍。在COCO基准上进行的大量实验证明了该方法的有效性。该论文审稿初审评分在所有ICLR(2021)论文投稿中排名并列第2,作为口头报告(Oral)被深度学习领域顶级会议ICLR(2021)接收。