Facebook开源Opacus,一个训练PyTorch模型的不同隐私的库,它说它比现有的库要快得多

2020-09-02 17:27:23

Facebook今天开源了Opacus,这是一个训练PyTorch模型的库,具有不同的隐私,表面上比现有方法更具可扩展性。Facebook表示,随着Opacus的发布,它希望为工程师在AI中采用差异隐私提供一条更容易的途径,并加速现场差异隐私研究。

通常,差异隐私需要在将原始数据送入本地机器学习模型之前向其注入少量噪声,从而使恶意行为者难以从训练的模型中提取原始文件。如果观察者看到算法的输出不能辨别它是否在计算中使用了特定个人的信息,那么算法可以被认为是差分私有的。

“我们使用Opacus的目标是保护每个训练样本的隐私,同时限制对最终模型准确性的影响。Opacus通过修改标准PyTorch优化器来实现这一点,以便在培训期间强制(和测量)差异隐私。更具体地说,我们的方法是以差分私有随机梯度下降为中心的,“Facebook在一篇博客文章中解释道。“这个算法背后的核心思想是,我们可以通过干预模型用来更新其权重的参数梯度,而不是直接干预数据,来保护训练数据集的隐私。”

根据Facebook的说法,Opacus独一无二地利用PyTorch中的钩子实现了与现有库相比的“数量级”加速。此外,它还跟踪“隐私预算”-差异隐私中的核心数学概念-在任何给定的时间点花费了多少,以实现实时监控。

Opacus还为安全关键代码采用了密码安全、伪随机、GPU加速的数字生成器,并附带了可警告不兼容组件的教程和帮助器函数。Facebook表示,该库使用PyTorch在幕后工作,生产标准的人工智能模型,可以像往常一样部署,而不需要额外的步骤。

Facebook写道:“我们希望,通过开发像Opacus这样的PyTorch工具,我们正在将对此类隐私保护资源的访问民主化。”我们正在通过使用PyTorch的更快、更灵活的平台来弥合安全界和普通机器学习工程师之间的鸿沟。“。

在Opacus发布之前,谷歌决定开源其一些核心产品(如谷歌地图)中使用的差异隐私库,以及一个专门用于TensorFlow Privacy的高级实验模块,该模块可以对各种机器学习分类器的隐私属性进行评估。最近,微软发布了Whitenoise,这是一个平台无关的工具包,在Azure和GitHub的开源中用于区分隐私。