西班牙警方计划在功效尚不清楚的情况下延长测谎仪的使用

2020-10-27 18:03:14

Veripol是一款评估西班牙国家警察投诉真实性的软件。它是在2018年推出的,但目前还不清楚它是否如预期的那样起作用。

两年前,西班牙国家警察在警察局引入了一种名为Veripol的工具,以帮助检测虚假投诉,例如有人声称发生了一起从未发生的抢劫。这是西班牙第一次使用这样的工具,可能也是在世界范围内使用。

Veripol是一个计算机程序,它扫描抢劫、扒窃和抢钱包的投诉。它评估了投诉不属实的可能性。当它在2018年推出时,它的目的是帮助警方调查人员决定报告的真实性。主要目标是节省时间并防止保险欺诈-例如,当有人谎报手机被盗时。

根据内政部向AlgorithmWatch提供的数据,自2018年10月推出以来,Veripol已被用于约8.4万起投诉。

例如,在西班牙,模拟犯罪本身就是一种犯罪,指的是那些保证自己是盗窃的受害者,但没有为此指控特定人的人。2019年,也就是唯一可以获得数据的完整年份,Veripol处理了49702起投诉,其中2338起导致了一起模拟犯罪的案件。将投诉归类为模拟并不仅仅基于Veripol的结果。

内政部的一位消息人士告诉AlgorithmWatch,Veripol将大约每20起投诉中就有一起标记为模拟犯罪。总体而言,这个部长部门表示,这些犯罪类别的所有查询中,约有三分之一是由Veripol处理的。

该部还表示,自从引入Veripol以来,关于抢劫和特定类型盗窃的投诉数量有所减少,侦破的模拟犯罪案件也减少了。国家统计局关于登记犯罪的数据只更新了2019年之前的数字,但倾向于证实该部的观点,即模拟数量减少了。然而,鉴于总体犯罪数字在Veripol使用数量减少的情况下保持不变,这可能表明Veripol在警察中越来越不受欢迎。

国家警察运营的大约240个派出所都有Veripol(加泰罗尼亚和巴斯克地区有自己的警察部队,治安职责与国民警卫队分担)。目前,国家警察只使用Veripol,但该部的消息来源证实,计划将其用于更广泛的犯罪活动,并将其引入国民警卫队的系统。

在纸面上,该算法仅供训练有素的代理使用。然而,对身为“21世纪警察”协会成员和联邦警察联盟成员的几次采访显示,情况截然不同。“21世纪警察”是一个倡导团体,在一些问题上与政府意见相左。许多特工还没有接受过适当的培训,他们中的一些人发现这个系统很难准确。

许多人说,Veripol的一般用途相当有限。他们认为这是一种“理论方法”有效的工具,但与他们在警察局的日常工作不相结合。首先是因为缺乏培训,其次是因为许多官员说提交报告的方式与Veripol的使用不符。

当一个人到警察局投诉时,警察会用他或她自己的话抄写投诉人的话。即使投诉是在网上预先录制的,当投诉人去车站签名时,官员们也可以更改它。

一名警官告诉AlgorithmWatch:“我们从来不会严格抄写原告的话。”“例如,我们大多数句子都需要以‘That’这个词开头。公务员用他自己的话写下了他从你的故事中理解到的东西。“这位官员补充说。关于Veripol的部分培训包括教授官员如何以软件可以处理的方式书写。

内政部的一位消息人士说,Veripol是一个补充工具,它的使用取决于特工的能力和专业知识。消息人士补充说,一旦算法给出结果,就必须进行进一步的调查,这需要人力。只有在原告承认投诉是不真实的情况下,投诉才会被归类为虚假。

尽管Veripol没有被归类为机密,但自推出以来,几乎没有公开的细节。它所基于的算法是由一名拥有数学博士学位的前警官和三名西班牙研究人员开发的。他们共同撰写了一项科学研究,发表在“基于知识的系统”杂志上。在报告中,他们声称Veripol在训练数据集中只将100个真实投诉中的5个标记为虚假,而将100个虚假投诉中的11个错误标记为真实。

它在2015年西班牙提交的1122份抢劫报告的语料库上进行了培训,其中包括534份真实报告和588份虚假报告。他们都是匿名的。

对于真假报道的标签,涉及到一名具有“丰富的审讯、测谎和调查经验”的警官。他在两年的时间里对1122份报告进行了审查和分类。作者争辩说,这是建立语料库的最好方法,因为“虚假报告的真实比率”无法得知。

根据当时的官方统计数据,2015年西班牙登记的抢劫报告中只有25%是虚假的。令人怀疑的逻辑是,研究人员声称,由于大约五分之四的抢劫案仍未破案,真实的虚假投诉数量肯定更高。

他们的估计是基于这样一个事实,即他们在2015年提交的所有报告中,“清除虚假抢劫报告最成功的警察局”的“虚假率”为57%。

提交给Veripol的报告是由训练有素的特工撰写的,这意味着文本在被软件处理之前会通过第一个过滤器。根据宣誓法律语言专家、总部位于巴塞罗那的SQ法医语言公司负责人希拉·奎拉特(Sheila Queralt)的说法,这以及Veripol接受培训的方式(一名专门的特工将报告定义为真或假)表明,“分析的参数是不客观的”。

奎拉特女士说,虚假报告的问题已经充满了不确定性。对她来说,维里波尔只是把人类的不确定性变成了机器的不确定性。她补充说:“我们不知道软件是如何被操纵的,因为它不适用于原告的直接证词,而适用于警方特工撰写的抄本或摘要。”

Queralt女士说,Veripol的工作原理是识别语言学研究已经证明是可能谎言的识别符的单词和短语。例如,使用许多形容词或拒绝描述一个场景都被认为是投诉人在撒谎的暗示。她解释说:“对我来说,除了知道它在多大程度上起作用外,最重要的是如何构建用于提取算法的语料库。”

的确,具体的词语似乎很有分量。为这篇文章接受采访的一名警官说,“小刀”这个词足以让Veripol将一份报告归类为真实。

数据正义实验室(Data Justice Lab)的研究员菲克·詹森(Fieke Jansen)表示,测谎器故障的历史由来已久,尽管在警察部门通过文本分析检测欺诈是一件新事物。

詹森女士说,这件事也有性别、世代、阶级和种族的因素。除非警方确保算法不会进行不公平的歧视,否则系统可能会无意识地寻找某些人口统计数据最常使用的特定单词或句子结构。