NVAE:一种深层次变分自动编码器

2020-09-22 08:59:00

下载PDF摘要:归一化流程、自回归模型、变分自动编码器(VAE)和基于深度能量的模型是深度生成性学习的基于可能性的竞争框架。其中,VAE具有采样速度快、易处理、编码网络易接入等优点。然而,它们目前的表现经常被其他模型所超越,如归一化流量和自回归模型。虽然对VAE的大部分研究都集中在统计挑战上,但我们探索了仔细设计分层VAE的神经结构的正交方向。我们提出了Nouveau VAE(NVAE),这是一种深层次的VAE,它使用深度方向可分离卷积和批归一化来生成图像。NVAE采用正态分布的残馀参数化,其训练通过谱正则化来稳定。我们表明,NVAE在MNIST、CIFAR-10和CelebA HQ数据集上的非自回归似然模型中取得了最先进的结果,并为FFHQ提供了强大的基线。例如,在CIFAR-10上,NVAE将最先进的每个维度的位数从2.98提高到2.91,并在CelebA HQ上生成高质量的图像,如图1所示。据我们所知,NVAE是第一个成功应用于256$\x$256像素的自然图像的VAE。