用于深度学习的合成数据

2020-07-02 23:08:56

下载PDF摘要:合成数据是一种越来越受欢迎的工具,用于训练深度学习模型,特别是在计算机视觉方面,但也在其他领域。在这项工作中,我们试图对合成数据的发展和应用的各个方向进行全面的综述。首先,我们讨论了基本计算机视觉问题的合成数据集,包括低级(例如光流估计)和高层(例如语义分割),室外和城市场景的合成环境和数据集(自动驾驶),室内场景(室内导航),空中导航,机器人的仿真环境,计算机视觉之外的合成数据的应用(在神经编程,生物信息学,自然语言处理等方面);我们还综述了改进合成数据开发的工作和产生合成数据的替代方法,如GANS。其次,我们详细讨论了合成数据应用中不可避免的领域自适应问题,包括基于GaN模型的合成到真实的精化和没有显式数据转换的特征/模型级的领域自适应。第三,我们转向与竞争相关的合成数据应用,并回顾了生成具有不同隐私保障的合成数据集的工作。最后,我们强调了在合成数据研究中进一步工作的最有前途的方向。