面部识别揭示了困扰新研究的政党

2021-01-15 20:47:00

这项研究于本周发表在《自然》杂志的《科学报告》上,由斯坦福大学的米哈尔·科辛斯基(Michal Kosinski)进行。科辛斯基(Kosinski)在2017年成为头条新闻,他的工作发现可以通过面部数据预测一个人的性偏爱。

这项研究引起的批评不是因为它的方法,而是因为可以通过这种方式检测到一些概念上非物理的东西。但是科辛斯基(Kosinski)的工作,正如他当时及其后解释的那样,是专门为挑战这些假设而做出的,对他和其他人一样令人惊讶和不安。这个想法不是要建立一种AI Gaydar,实际上恰恰相反。正如团队当时所写的那样,有必要发布以警告其他人,这种事情可能是由那些兴趣超出学术界的人制造的:

我们真的为这些结果感到不安,并花了很多时间考虑是否应将它们公开。我们不想承担我们警告的风险。控制何时和向谁透露性取向的能力不仅对一个人的幸福至关重要,而且对一个人的安全也至关重要。

我们认为迫切需要使决策者和LGBTQ社区意识到他们所面临的风险。我们并未创建侵犯隐私的工具,而是表明基本且广泛使用的方法构成了严重的隐私威胁。

这里可能会发出类似的警告,因为尽管至少在美国(至少目前),政治派别不像性偏好那样敏感或人格化,但它仍然是敏感和人格化的。一周几乎没有阅读过一些政治或宗教上的“持不同政见者”,或另一人被捕或被杀害。如果压迫性政权通过说“该算法将您标记为可能的极端分子”来获得可能的原因,而不是例如截取消息,它将使这种做法变得更加容易和可扩展。

该算法本身并不是某些高级技术。 Kosinski的论文描述了一种相当普通的过程,该过程是从美国,加拿大和英国的约会网站以及美国Facebook用户那里收集超过一百万张面孔的机器学习系统图像。该网站的调查问卷中,使用面部表情的人被认为是政治上的保守派或自由派。

该算法基于开放源代码的面部识别软件,经过基本处理以仅裁剪到面部(这样就不会有背景项目的出现),然后将面部缩小为代表各种特征的2,048分,就像其他面部识别一样这些算法不是“眉毛颜色”和“鼻子类型”之类的直观必需的东西,而是更多计算机本地概念。

该系统获得了来自人民本身的政治隶属关系数据,并以此勤奋地开始研究被识别为保守派的人与被识别为自由派的人的面部统计数据之间的差异。因为事实证明,存在差异。

当然,这并不像“保守派眉毛浓密”或“自由主义者皱眉更多”那样简单。它也不能归结为人口统计学,这会使事情变得太容易和太简单了。毕竟,如果政党认同与年龄和肤色都相关,那么就可以使用一种简单的预测算法。但是,尽管科辛斯基使用的软件机制相当标准,但他还是小心翼翼地掩盖了自己的基础,以使这项研究(如最后一项研究)不能被视为伪科学。

解决该问题的最明显方法是让系统对相同年龄,性别和种族的人的政党进行猜测。测试涉及到呈现两张面孔,每一方一张,并猜测哪一张。显然机会准确度是50%。人类不是很擅长此任务,其执行的几率仅略高于机会,准确率约为55%。

当预测两个类似个人之间的政党时,该算法的准确率高达71%,而有73%的人则表示两个年龄,种族或性别的个人(但仍保证是一个保守,一个自由主义者)。

四分之三的获得似乎并不是现代AI的胜利,但是考虑到人们几乎不可能比掷硬币做得更好,所以这里似乎值得考虑一些事情。科辛斯基也一直小心翼翼地覆盖其他基地。这似乎不是统计异常或孤立结果的夸大。

可能将政党写在脸上的想法令人不安,因为尽管一个人的政治倾向远非最私人的信息,但也被合理地认为是无形的。人们可能会选择戴着帽子,别针或T恤来表达自己的政治信仰,但人们通常认为自己的脸无党派。

如果您想知道哪些面部特征特别明显,很遗憾,系统无法报告该情况。在一项辅助研究中,科辛斯基分离了十几个面部特征(面部毛发,凝视的直觉,各种情感),并测试了这些特征是否是政治的良好预测指标,但没有一个比准确率或偶然性或准确性提高了一点人类的专业知识。

科辛斯基在论文的作者笔记中写道:“头部取向和情感表达非常突出:自由主义者倾向于更直接面对镜头,更有可能表达惊讶,而不太可能表达厌恶。”但是他们添加的内容却没有超过10个百分点的准确性:“这表明面部识别算法发现了许多其他特征,揭示了政治取向。”

“这不可能成立–颅相学是蛇油”的膝关节辩护在这里没有多大用处。令人难以置信的是,它是真的,但它并不能帮助我们否认可能是一个非常重要的事实,因为它很容易被人使用。

与性取向研究一样,这里的目的不是要为这种信息创建一个完美的检测器,而是要表明可以做到这一点,以便人们开始考虑所造成的危险。例如,如果一个压制的神权政权想要镇压异性恋者或具有一定政治倾向的人,则这种技术为他们提供了一种“客观地”做到这一点的可行技术方法。而且,与挖掘目标对象的社交媒体历史或分析他们的购买(也非常有启发性)不同,只需花费很少的工作或与目标者接触即可完成目标。

我们已经听说过中国在使用面部识别软件来寻找陷入困境的维吾尔族宗教少数群体的成员。而且在我们自己的国家,这种AI也受到当局的信任-不难想象警察使用“最新技术”对抗议活动中的人脸进行分类,并说“这10个是由系统确定的,成为最自由的人”,或者您拥有什么。

几个研究人员使用开源软件和一个中等大小的面部数据库(对于政府而言,这是微不足道的,因为这种组合不太可能出现,而现在还没有),这种想法可以在世界上任何地方实现,目的,令人不寒而栗。

“不要开枪,”科辛斯基说。 “在我的工作中,我警告人们不要使用广泛使用的面部识别算法。令人担忧的是,那些AI生理学家现在正被用来判断人们的内在特质-学者,决策者和公民应该注意。”