运动分组自我监督的视频对象分割

2021-04-17 14:50:23

动物已经进化了高度功能的视觉系统,以了解运动,即使在复杂的环境下也能够帮助感知。在本文中,我们努力通过利用运动提示来开发能够分段对象的计算机视觉系统,即运动分割。我们提出以下贡献:首先,我们引入了变压器的简单变体,将光学流帧分段为主对象和背景。其次,我们以自我监督的方式训练架构,即,不使用任何手动注释。第三,我们分析了我们方法的几个关键组成部分,并进行了彻底的消融研究,以验证其必需品。第四,我们在公共基准(Davis2016,Segtrackv2和FBMS59)上评估拟议的架构。尽管仅使用光流量作为输入,但我们的方法与以前的最先进的自我监督方法相比,卓越的结果达到了卓越的结果,同时是一个更快的数量级。我们还在挑战伪装数据集(MOCA)上进行评估,显着优于其他自我监督的方法,以及对顶级监督方法有利地进行比较,突出了运动提示的重要性,以及现有视频分段模型中的视觉外观的潜在偏见。