Warning: Can only detect less than 5000 characters
结果如图2所示。2(蓝色条)。当区分所有可能对的面部保守和一个自由主义时,准确性表示为AUC,或者一小部分正确猜测。在最大的样本中,862,770美国约会网站用户,交叉验证的分类精度为72%,远高于偶然(50%),并转化为COHEN的D = 0.83,或大效果大小。 (Sawilowsky 25表明以下启发式解释效果大小:非常小[D≥0.2],介质[D≥0.5],大[D≥0.8],非常大[D≥1.2],和巨大的[D≥2]。)在加拿大的约会网站用户(71%)和英国(70%)进行类似的准确性。预测性不限于在线约会环境:算法的准确性在美国Facebook用户中达到73%。要将算法的准确性分为透视,请考虑类似任务中的人类准确性为55%,仅略高于机会(SD = 4%; CI 95%= [52%,58%])15。
预测政治定位的面部识别算法的准确性。所有95%的置信区间均低于1%,因此省略。在其他研究中报告的人类和算法的准确性被包括在上下文中。
此外,如表2所示,该算法可以成功地预测各国和样本的政治取向。例如,在美国约会网站用户培训的回归可以区分加拿大(68%),英国(67%)和Facebook样本(71%)的自由主义和保守的约会网站用户。总的来说,平均样本精度为68%,表明面部提示与在此检查的各国之间的面部提示和政治取向之间存在显着重叠。
无论是在现实生活中,在我们的样本中,政治定位的分类都在某种程度上,由参与者面临的人口统计特征实现。例如,在文学26和表1中证明,在美国,白人,老年人,男性和男性更有可能是保守派。算法的准确性会在区分同龄人的面孔,性别和种族的脸上?为了回答这个问题,只使用相同年龄,性别和种族的面对对进行分类准确性。
结果如图2所示。2(红色条)。精度平均下降3.5%,达到美国,加拿大和英国约会网站用户的68%,68%,65%和71%,以及美国Facebook用户。这表明面孔含有比仅仅年龄,性别和种族的政治取向提示。
影响分类准确性的另一个因素是政治定位估计的质量。虽然这里使用的二分法表示(即保守与自由主义)广泛用于文献中,但它仅提供了对意识形态的复杂人际关系差异的粗略估计。此外,自我报告的政治标签患有参考群体效应:受访者在突出比较组的背景下评估其特征的倾向。因此,如果他们住在自由主义马萨诸塞州,那么来自保守的密西西比州的自我描述的“自由主义”可以很好地考虑“保守派”。如果政治取向估计更加精确(即,误差较少),则面向面部算法的准确性可能更高。因此,除了考虑绝对的分类准确性之外,将其与通过替代方法预测政治定位的方式进行比较是有用的。在这里,我们使用个性,一个与之密切相关的心理构建,并且经常被用来近似,政治定位27. Facebook用户在成熟的100项长度五因素模型上的人格问卷28的比分被进入十倍交叉验证的逻辑回归以预测政治定位。
图3中所示的结果表明,通过开放的经验(65%)提供最高的预测力,其次是休闲性(54%)和其他特征。在与以前的研究27同意中,自由主义者更加开放,经验更加开放,有点不太殷勤。合并,五个个性因素预测了66%的政治取向,精度为66% - 显着低于同一样品中的面部基础分类器(73%)所达到的。换句话说,一个面部形象揭示了一个人的政治定位,而不是对一个相当长的个性调查问卷的反应,包括许多与政治定位有关的许多物品(例如,“我同样对待所有人”或“我相信太多税金来支持艺术家“)。
Warning: Can only detect less than 5000 characters
约会网站样本由2017年由一个受欢迎的约会网站提供。它包含上传的个人资料图像,由977,777用户上传;他们的位置(国家);和自我报告的政治定位,性别和年龄。
使用多项选择项目测量政治定位。那些选择“非常保守”(7%)或“保守”(20%)的人被标记为保守派;那些选择“非常自由主义”(7%)或“自由主义者”(16%)的人被标榜为自由主义。那些选择“绿色”(1%),“自由女神经”(2%),“其他”(5%),“中心”(17%),或者不知道(26%)不包括在此样本中。 (这些响应选项以略微更改的形式报告以保护数据源的身份。)
鉴于人们更喜欢类似的政治定位的合作伙伴36,在约会网站的背景下歪曲一个人的看法应该很少有动力。该变量的有效性也得到了政治定位分类器的高精度和高外部有效性。
Facebook样本包括公众个人资料图片,年龄,性别,政治导向和人格分数由2007年至2012年之间的在线个性调查问卷招募108,018名美国Facebook用户。参与者因其分数的反馈得到了奖励,并为其提供了知情同意要记录和用于研究的数据。
参与者的个性是使用100项国际人格项目池(IPIP)五因素调查表28的五因素模型来衡量,其中五点李克特式响应量表从“非常不同意”到“非常同意”。尺度的Cronbachα可靠性平均为84,0.92,0.93,0.88和0.93,分别用于开放性,休闲性,途径,令人满意和神经质。衡量开放性的两个项目被排除在得分之外,因为它们被用来衡量参与者的政治定位(见下文)。
参与者的政治定位是利用“政治观点”个人资料领域和来自iPIP人格调查问卷的两项:“我倾向于为自由政治候选人投票”,“我倾向于投票支持保守派政治候选人。”要标记为保守派,参与者需要自我描述为“共和党”(10%),“保守派”(12%),或“非常保守”(2%);与前IPIP项目不同意(11%)或强烈不同意(9%);并同意(10%)或强烈同意后者(12%)。被标记为自由主义,参与者需要自我形式为“民主党”(15%),“自由主义”(15%)或“非常自由派”(5%);并同意(16%)或强烈同意第一个IPIP项目;并不同意(20%)或强烈反对(17%)后者。没有符合这些标准的参与者未包含在此样本中。
使用面部++ 37处理面部图像以检测面部。图像围绕面部++(图1的红色框架)提供的面部框裁剪,并调整为224×224像素。在我们的样本中不包括多个面或较窄的面部框,或者面部框比70像素更窄。
此外,面部++用于识别参与者的年龄,性别和种族(白色,黑色,东亚和印度人);头定向(俯仰,卷和偏航;见图3);情绪表达(表达悲伤,厌恶,愤怒,惊喜和恐惧的概率);和任何类型的眼镜或太阳镜的存在。这些估计的准确性很好。预测和自我报告的年龄在r = 0.65级相关(p <0.001;均均线误差等于三年)。预测和自我报告的性别匹配96%的参与者。面对++估计的种族和一个假设 - 盲目研究助手匹配了88%的27,023个面部图像,这是Facebook样本的子集。两个假设 - 盲目研究助手用Facebook样本标记了300个图像的子集,其中具有面部表情和头部姿势的估计。平均排名和面部++估计之间的相关性平均为r = 0.72(参见补充表S2)。
分类就业L2标准化
......