在考虑数据隐私和保护时,无论是医疗,财务甚至社交,都没有比个人数据更重要的数据。围绕访问我们的数据,甚至我们的元数据的讨论变得谁知道什么,以及我的个人数据是安全的。今天在英特尔,微软和DARPA之间的公告是一个围绕保持信息安全和加密的程序,但仍然使用该数据来构建更好的模型或提供更好的统计分析而不披露实际数据。它被称为完全同性恋加密,但它是如此在计算上强烈,概念在实践中几乎没用。这三家公司之间的该程序是提供IP和硅的驱动程序,以加速计算,从而实现更安全的协作数据分析环境。
数据保护是计算未来最重要的方面之一。个人数据的数量不断增长,以及该数据的价值以及所需的法律保护人数。这使得任何处理个人,私密和机密数据的处理甚至常常导致专用数据芯盘,因为任何处理都需要与加密/解密耦合的数据传输,涉及并不总是可能的信任。所有所需要的是链中的一个键丢失或泄露,数据集受到损害。
围绕此方法,称为完全同性恋加密(FHE)。 FHE使能够进行加密数据,将其转移到它需要去的位置,对其进行计算,并在不知道确切的基础数据集的情况下获得结果。
例如,分析医疗数据记录:如果研究人员需要处理某些分析的特定数据集,则传统方法将是加密数据,发送数据,解密数据,处理它 - 但是给予研究人员获取记录中的具体细节可能不是法律或面临的监管挑战。使用FHE,研究人员可以采用加密数据,执行分析并获得结果,而不知道数据集的任何细节。这可能涉及对多个加密数据集的群体的统计分析,或者采用这些加密的数据集并将其用作培训机器学习算法的额外输入,通过具有更多数据来增强精度。当然,研究人员必须相信给定的数据是完整的和真实的,但是,它可以说是不同的主题,而不是在加密数据上计算计算。
为什么这一事项为什么是因为来自数据的最佳洞察来自最大的数据集。这包括能够培训神经网络,而最佳神经网络正在反对没有足够的数据的问题,或者在涉及到该数据的敏感性质时面临的监管障碍。这就是为什么完全同性加密,可以在不知道其内容的情况下分析数据的能力。
作为一个概念的完全同性恋加密已经发生了几十年,但是概念只在过去20年左右的情况下实现了。提出了许多部分均匀加密方案,并在该初始时间表中提出,自2010年以来,可以使用与行业标准开发的许多库开发出了对加密数据或CypherText上的基本操作的几个PHE / FHE设计。其中一些是开源。由于处理加密数据,很多这些方法都是计算复杂的,但是由于处理加密数据,尽管正在使用类似SIMD的包装和其他功能来加速处理的努力。即使执行计划正在加速,这与解密不相同,因为数学没有解密数据 - 因为数据始终处于加密状态,所以它可以(可以说)由不可信的第三方使用根本信息永远不会暴露。 (一个人可能会争辩说足够的数据集可以透露超过预期的仍然是加密的。)
测量FHE计算性能时,将结果与对数据的普通文本版本的分析进行比较。由于FHE计算的计算复杂性,电流计算方法显着较慢。启用FHE的加密方法可以将数据的大小增加100-1000x,然后在该数据上计算比传统计算慢10000倍至100万次。这意味着原始数据上的一秒计算可能需要3小时到12天。
因此,是否意味着将医院医疗记录组合在一个状态,或使用在用户智能手机上聚集在用户的智能手机上聚集的个人元数据来定制个人服务,因此该规模不再是可行的解决方案。输入DARPA Dprive程序。
英特尔宣布作为熟练方案的一部分,它签署了与DARPA的协议,以开发通往硅的自定义知识产权,以便在云中更快地实现云彩,特别是与美国政府的微软。作为这个多年项目的一部分,英特尔实验室,英特尔设计工程和英特尔数据平台组的专业知识将集中在一起,以创建专用的ASIC,以减少基于CPU的现有CPU的方法的计算开销。新闻稿状态指出目标是从当前方法减少5个级别的处理时间,从天到几分钟减少计算时间。
当谈到FHE时,英特尔已经有一只脚在门口,在英特尔实验室内有一个研究团队,致力于这个问题。这主要是在软件,标准和监管障碍方面,但现在也将进入美国政府的Azure和Jedi Cloud中的硬件设计,云软件堆栈和协作部署。其他突出的目标市场包括医疗保健,保险和金融。
在2020年12月20日的英特尔实验室日期间,英特尔详细说明了它已经参与了这项工作的一些方向,以及标准和发展,并在国际规模上鉴于额外的监管障碍。微软现在将成为与Dprive计划讨论的一部分,以及英特尔在学术级别的持续投资。
除了“五个数量级的元素”元素之外,今天的公告并不超出创造明确目标,而不是呈现时间框架,而是说这是一个“多年”协议。看看英特尔或其学术附属机构在今天超出工作标准化之外讨论了多少英特尔或其学术联系。
发表评论拼写和语法错误:"但它是如此计算地激烈,在实践中概念几乎没用。"缺少"是&#34 ;:"但它是如此的计算上的概念在实践中几乎没用。"
回复
这是越来越靠近能够作为商品计算的一步。回复
怎么会这样?这是作为服务的加密/解密。没有在一般意义上计算。回复
" fhe使能够进行加密数据,将其转移到需要去的位置,对其进行计算,并在不知道确切的基础数据集的情况下获得结果。"想象一下,我想训练一个网络,但我不想将我的培训数据分享给任何人,因为它是专有的,但我没有处理能力来训练网络的自我。所以我环顾四周,看看我是否可以找到最便宜的处理提供商。我可以使用GWS(Google Web服务)或RPP(俄罗斯处理提供商)。 RPP是最便宜,更不安,GWS是最昂贵但更安全的。如果我无法加密我的数据和处理提供者可以访问原始培训数据,那么我必须使用GWS并支付他们所需的任何费用,但如果我可以加密我的数据,并且他们可以在加密的数据集上训练网络,那么我不在乎谁更安全。我只会选择更便宜的人。此外,一旦我拥有我的网络训练,我就可以将我的训练网络发送到另一个处理提供商,以预制分析,如果另一个处理提供商变得更便宜。这减少了云空间的安全市场差异,以获得更多竞争和更低的价格。回复
FHE仍然比在未加密的数据上工作更昂贵的数量级,即使是最乐观的未来探索也使其剩下多种倍数更昂贵。所以肯定的是,你可以买到一些半价的俄罗斯云服务,但你仍然会使用5倍的计算力量(甚至假设英特尔'最伟大的梦想是实现的)所以你'仍然付钱如果您在您信任的服务器上讨论未加密的数据,请多次。 FHE将在未加密的数据上工作*可行*,但它不会是*更便宜的*。回复
提供什么FHE不是加密 - 它在加密数据上处理,而不将该数据暴露给数据处理器。然而它'仍然比自己做得更慢,这是一个服务。回复
当英特尔最终开发新的X86架构以及AMD和#39; ZEN2 / 3时,它将是一个里程碑。直到那时....哈欠......回复