来自以色列的研究人员开发了一种能够生成“主”面孔的神经网络——每个人脸图像都能够模仿多个 ID。这项工作表明,通过三个领先的人脸识别系统,仅使用 StyleGAN 生成对抗网络 (GAN) 合成的 9 张人脸就可以为超过 40% 的人口生成这样的“主密钥”。该论文是特拉维夫 Blavatnik 计算机科学学院和电气工程学院之间的合作。在测试该系统时,研究人员发现,生成的单个人脸可以解锁马萨诸塞大学野生标记人脸 (LFW) 开源数据库中所有身份的 20%,该数据库是用于开发和测试面部识别系统的通用存储库,以及以色列系统的基准数据库。新方法改进了锡耶纳大学最近的一篇类似论文,该论文需要对机器学习框架的特权级别访问。相比之下,新方法从公开可用的材料中推断出广义特征,并使用它来创建跨越大量身份的面部特征。 StyleGAN 最初用于这种方法下的黑盒优化方法(不出所料)专注于高维数据,因为找到满足身份验证系统的最广泛和最通用的面部特征很重要。然后迭代地重复此过程以包含未在初始传递中编码的身份。在不同的测试条件下,研究人员发现仅生成九张图像就可以获得 40-60% 的认证。该系统使用进化算法与神经预测器相结合,该算法估计当前“候选人”的可能性比先前通过生成的候选人的 p 百分位数更好地概括。
该项目使用有限内存矩阵适应 (LM-MA-ES) 算法,该算法是为 2017 年由机器学习自动化算法设计研究小组领导的一项计划开发的,该方法非常适合高维黑盒优化。 LM-MA-ES 随机输出候选。虽然这非常适合项目的意图,但需要一个额外的组件来推断哪些人脸是交叉身份验证的最佳候选者。因此,研究人员创建了一个“成功预测器”神经分类器,将大量候选人筛选为最适合该任务的面孔。该系统针对三个基于 CNN 的人脸描述符进行了测试:SphereFace、FaceNet 和 Dlib,每个系统架构都包含一个相似性度量和一个损失函数,这对于验证系统的准确性分数非常有用。 Success Predictor 是一个前馈神经网络,包含三个全连接层。其中第一个使用 BatchNorm 正则化来确保激活前数据的一致性。该网络使用 ADAM 作为优化器,对 32 个输入图像的批次具有 0.001 的雄心勃勃的学习率。测试的所有三种算法都使用相同的五个种子集进行了 26,400 次适应度函数调用的训练。研究人员此时已经确定,更长的训练过程对系统没有好处。实际上,以色列的方法正在寻求从模型训练的早期阶段获取关键数据,其中只有最高的特征尚未被识别。值得注意的是,就框架经济而言,这是一份礼物。使用 Facebook 的基于 Python 的 NeverGrad 无梯度优化环境建立基线结果后,该系统针对多种算法进行了分析,包括各种品牌的差分进化启发式算法。
研究人员发现,基于 Dlib 的“贪婪”方法优于其竞争对手,成功创建了 9 个能够解锁 42%-64% 测试数据集的主人脸。系统的成功预测器的应用进一步改善了这些非常有利的结果。该论文认为,“基于面部的身份验证极其脆弱,即使没有有关目标身份的信息”,研究人员认为他们的举措是一种有效的面部识别系统安全入侵方法。