2019年4月,Parabon Nanolab的一切开始分崩离析。当时,它是地球上最著名的法医遗传学公司。在弗吉尼亚州莱斯顿的总部,Parabon几乎每周都在帮助警方破获冷犯罪案件,例如1987年一对加拿大夫妇被谋杀,以及20世纪60年代一名年轻女子被性侵并杀害的案件。
该公司通过将嫌疑人的DNA与家谱数据库中的个人资料进行比较,并拼凑家谱来追踪涉嫌违法者,从而成名。
但所有这些胜利都涉及废弃已久的案件。然后,Parabon帮助解决了它的第一起正在审理的案件,在犹他州的一家摩门教会所,一名十几岁的男孩暴力袭击了一名70多岁的老人。Parabon本可以取得的最高成就,最终却在一夜之间阻止了该业务的迅速崛起。
由于对隐私的担忧,它被否决了。Parabon的系谱学家一直在通过筛选一个名为GEDMatch的DNA测试数据库来产生线索,GEDMatch是一个免费使用的网站,允许用户上传测试结果,希望能找到失散已久的亲人。当时,GEDMatch允许执法机构访问这些个人资料,以帮助解决谋杀和性侵犯案件,除非用户明确选择退出。在Parabon和类似公司的帮助下,警方每周都会进行新的逮捕。
但犹他州的案件既不是谋杀,也不是性侵犯,因此该网站的免责声明没有涵盖这一事件。袭击者在现场留下了血迹,负责此案的侦探马克·塔加特(Mark Taggart)亲自请求GEDMatch的创始人柯蒂斯·罗杰斯(Curtis Rogers)访问数据库。当它被批准时,最初拒绝此案的Parabon签署了协议。该公司追踪了几个与居住在该地区的个人的部分DNA匹配,并缩小了嫌疑人的范围,这名嫌疑人是其中一人的亲属,是一名十几岁的男孩。塔格特逮捕了他。
这立即引发了系谱学家、隐私专家和更广泛的公众对违反GEDMatch与用户协议的强烈反对。作为回应,罗杰斯要求该网站的数百万用户明确选择执法使用。一夜之间,巴拉邦失去了它的命脉。
事实证明,这是该公司的一个转折点,也是法医基因谱系的一个转折点。在那之后的一年里,对GEDMatch数据的限制迫使Parabon通过回归其早期的商业战略之一来规划一条新的前进道路:尝试使用DNA重建面部。Parabon仍然提供法医家谱服务,但这些限制为竞争对手创造了机会,这些竞争对手正试图在这一领域确立自己的主张。
就像法医基因图谱的显赫地位越来越高一样,它的恶名也越来越臭名昭著。伦理学家对中国使用基因图谱来瞄准维吾尔族表示担忧,维吾尔族是中国西北省份的一个以穆斯林为主的少数民族人口。在过去的一年里,美国政府启动了两个项目,开始从移民在押人员和一些寻求庇护者身上提取DNA样本。美国司法部(US Department Of Justice)去年11月发布了指导方针,试图对法医基因谱系的使用设定界限,但对警察对美国黑人的暴行和系统性种族主义的担忧引发了人们的疑问,即这些指导方针是否为有色人种提供了足够的保护,这些有色人种被警方拦截的比例过高,在犯罪DNA数据库中的比例过高。这些法律、伦理和社会问题--再加上帕拉邦的痛苦--让业内专家想知道法医基因组学的下一步是什么。
比利时鲁汶天主教大学的生物学家兼工程师伊夫·莫罗(Yves Moreau)说:“因为DNA是如此强大,我们倾向于将其视为一颗银弹。”但他说,执法机构正在使用的数据库和技术并不是为破案或产生线索而设计的。“这就像一把刀--人们低估了他们的锋利程度。”
2017年12月,遗传系谱学家芭芭拉·雷-文特尔(Barbara Rae-Venter)接到了推动家谱取证进入公众视野的电话。她经营着一家使用GEDMatch寻找客户失散已久的亲戚的公司,当时她收到加州一名侦探的消息,这名侦探发现了一些旧的DNA证据,并试图重新审理金州杀手(Golden State Killer)的案件。金州杀手是一名连环强奸犯和杀人犯,在20世纪70年代和80年代犯下了一系列罪行。
DNA样本与家谱相结合是法医遗传谱系研究的核心内容。这个过程依赖于简单的遗传学统计规则。父母和孩子,或两个兄弟姐妹,有50%的DNA相同。祖父母和孙辈分享25%。即使是远亲也共享一小部分DNA。这使得消费者基因测试公司,如犹他州利希的祖先公司和加利福尼亚州桑尼维尔的23andMe公司,可以估计提交样本的两个人之间的关系,远至第四表亲(他们共享一对曾祖父母)。任何人都可以将自己的DNA测试结果上传到GEDMatch等数据库。
Rae-Venter找到了两个GEDMatch个人资料,看起来像是嫌疑人的第二表亲,并利用这些信息倒查了一下,找到了他们的曾祖父母。然后,她及时向前移动,追踪他们的后代,重点关注犯罪发生期间的加利福尼亚州。两个月后,雷-文特尔把三个兄弟的名字交给了侦探。一名兄弟丢弃的香烟的DNA与样本匹配,2018年4月24日,警方逮捕了约瑟夫·德安吉洛-这是第一起使用该技术破获的刑事案件。(DeAngelo承认多项强奸和谋杀罪名,并于上月被判处终身监禁。)。
在DeAngelo被捕后,Rae-Venter和CeCe Moore(2018年5月加入Parabon)等法医遗传系谱学家帮助快速解决了类似的悬案。尽管少数伦理学家提出了对隐私的担忧,但媒体对这些案件的报道绝大多数是积极的。“事实上,我很惊讶没有更多的批评,”遗传学家艾伦·麦克雷·格雷塔克(Ellen McRae Greytak)说,他是Parabon的生物信息学主管。
2018年11月17日星期六晚些时候,71岁的玛格丽特·奥兰多在犹他州森特维尔的摩门教会议室拨打了911。有人从窗户扔了一块石头,爬进去,在她练习风琴时袭击了她,勒死了她,直到她昏倒。塔加特被叫到现场,在那里他发现了三滴血,想必是袭击者在碎玻璃上割伤了自己。DNA图谱与州和联邦数据库中的任何人都不匹配,但与一位家谱学家朋友的偶然交谈给了塔加特希望:如果警方无法确认嫌疑人的身份,或许他们可以追踪到一个亲戚。他联系了GEDMatch,并获得了使用该网站的许可。
就像雷-文特尔帮助辨认金州杀手一样,帕拉邦向塔格特提供了三个可能的名字,其中一个他马上就认出了。这名男子住在会场附近,曾多次与警方发生冲突,塔加特发现他有一个17岁的侄子和他住在一起-一个与风琴手所描述的相符的侄子。
第二天,塔加特设法从嫌犯扔在学校垃圾中的牛奶盒中提取了DNA样本。它是匹配的。后续的拭子也是如此。塔加特于2019年4月24日逮捕了嫌疑人(由于他是未成年人,嫌疑人的名字没有透露)-也就是金州杀手被捕一年后的第二天。“这就像一个拼图拼在一起,”他说。
然而,随着解脱,公众的关注也随之而来。格雷塔克说:“人们对金州杀手的反应如此积极,而对此的反应却如此消极,我们对此感到有点惊讶。”她指出,“公共科学图书馆·生物学1”(PLoS Biology 1)的一项研究发现,90%的美国人支持警方使用法医基因谱系,并表示,一个规模不大但直言不讳的团体领导了对犹他州案件的强烈抗议。
英国纽卡斯尔诺森布里亚大学的伦理学家马蒂亚斯·维恩罗斯(Matthias Wienroth)对此有不同的看法。几乎在逮捕消息一传出后,维恩罗斯就对这种类型的搜索提出了隐私方面的担忧。Wienroth说,你有权通过将你的DNA档案上传到GEDMatch等网站来放弃自己的一些隐私,但这些网站也会降低你一些远亲的隐私。事实上,家庭DNA测试的激增使得一些基因系谱数据库变得如此之大,以至于2018年的一篇科学论文2估计,这些宝藏可以识别60%的欧洲血统的北美人,即使他们自己从未参加过这些测试。Greytak和Armentrout表示,他们已经将自己的结果上传到GEDMatch,并不担心他们可能会牵连到一个远亲。
“我们还在问这些技术在科学上是否有效。没有人谈论失败--我听到的都是成功。“维恩罗斯说。他指出,加州警方在意识到自己的错误并将重点放在迪安吉洛之前,首先从家谱的另一个分支追查线索。
但Greytak并不认为这是一个失败。她说,调查遗传系谱从来没有打算作为案件的最终答案。相反,她将其视为帮助执法部门创造线索的工具。这些线索-Parabon拒绝透露确切的数量-随着GEDMatch政策的变化而消失,带走了Parabon的主要收入来源之一。为了维持运营,Parabon将不得不回到它最早的战略之一。
史蒂文·阿门特劳特在他的地下室创办了Parabon,提供超级计算服务。Parabon的第一个重大突破是在2011年,当时这家羽翼未丰的公司申请了美国国防部(DoD)的拨款,试图根据一个人的DNA重建一个人的外表-这项技术被称为DNA表型分析。国防部希望开发这项技术,从炸弹上留下的微量DNA中识别简易爆炸装置的制造商,但他们也知道执法部门会感兴趣。大多数研究DNA表型的实验室都在寻找个人遗传密码单个字母的变化(称为单核苷酸多态性(SNPs))与眼睛或头发颜色等身体特征之间的关系。但Parabon将这一挑战框定为一次机器学习练习。它的计划是收集大量的DNA样本和面部照片,并训练算法来挑选关系。帕拉邦拿到了补助金。
它的方法对从血液样本和面颊拭子中提取的大量高质量DNA很有效。但法医样本通常很小,而且质量不佳。当Armentrout在2014年聘用Greytak时,该公司的第一个目标是看看商业基因分型阵列能否从法医样本中获得信息。当Parabon发出第一个样本时,实验室经理打电话说它永远不会起作用。这些芯片需要200毫微克的DNA。
“在法医学领域,200毫微克是一车货,”阿门特劳特说。Parabon送来的样本只有1毫微克。所有参与其中的人-包括Armentrout和Greytak-都惊讶地发现它奏效了。Parabon表示,它现在可以对足够多的SNP进行测序,以追踪家族病史,并用不到1毫微克的DNA塑造一张脸。Greytak说,使用如此少量DNA的测序运行通常会留下部分遗传密码空白,因为样本太过降解或过于稀释,无法读取。该公司的回应是建立专有算法,以预测其数学模型中的此类空白点。Greytak说,质量较低的DNA有时可能意味着预测的信心较低-但问题很少见。
Parabon的目标是雄心勃勃的:它想要提供某人祖先的全面分析和DNA样本的合成面部草图,而不仅仅是告诉警方嫌疑人有一头金发和绿色的眼睛。这项名为“快照”的手术于2014年12月发布。Parabon表示,自2018年以来,警方已经在他们的基因谱系和表型方法的帮助下破获了120多起案件(该公司以正在进行的调查为由,拒绝透露使用这些方法的案件总数)。
其他公司也开发了DNA表型策略,包括现已停业的Identitas,它专门使用SNPs预测身体外观,以及加利福尼亚州圣地亚哥的DNA测序巨头Illumina,它于2017年将其取证分支剥离,成立了一家新公司Verogen,也位于圣地亚哥。
几个学术实验室也在研究DNA表型。在荷兰鹿特丹的伊拉斯谟大学医学中心,曼弗雷德·凯瑟(曾是Identitas的顾问)在2011年开发了IrisPlex,根据DNA 3预测眼睛的颜色。自那以后,他的团队增加了更多的SNP,以捕捉更多的基因变异,并增加其他可识别的特征,如发色和质地。荷兰警方一旦在科学文献中进行了审查,就开始使用凯瑟的技术。最著名的例子发生在2012年,当时他们显示,强奸和谋杀16岁的玛丽安·瓦特拉(Marianne Vaatstra)很可能不是由靠近发现她身体的难民定居点的一名成员实施的。
与Parabon不同的是,Kayser不会试图将不同的特征编织在一起,试图重现一个人的脸。取而代之的是,他使用个人特征(比如赤褐色头发和淡褐色眼睛)作为执法线索。他发现Snapshot是有问题的,因为这项技术还没有在同行评议的文献中进行评估。
“我们对这张脸的了解非常有限,而这家公司表示,他们可以从DNA中预测到这一点。他们没有公布他们是如何做到这一点的,以及他们是如何验证这一点的,这是相当糟糕的,“凯瑟说。Kayser说,科学家已经发表了数百篇关于特定基因变异和身体特征之间关系的论文,但研究人员仍然不知道这些个体特征是如何成为一张独特的人类面孔的。
位于大学公园的宾夕法尼亚州立大学(Penn State)研究DNA表型的遗传学家马克·施莱弗(Mark Shriver)表示,由于血统对面部外观的影响非常大,他怀疑Parabon的数据正在创建一组普通的普通面孔,然后公司会对这些面孔进行调整,以填补空白。施莱弗说,在没有看到该公司在其机器学习系统中使用的数据和算法的情况下,“我们不知道他们估计面孔外貌的能力是否比偶然更好,或者这是否是基于我们对祖先的了解而得出的近似值。”
阿门特劳特说,帕拉邦不需要知道每个基因是如何影响容貌的,就可以创造出面孔的图像;他说,公司数据库中的SNP和面孔之间的关联性对于它的数学模型来说已经足够好了,警察部门的满意就是他所需要的全部证据。阿门特劳特说,仅仅因为该公司没有公布,并不意味着它的方法有缺陷。“我们的业务不是写论文,”他说。“结果不言而喻。”但施莱弗表示,逮捕并不意味着Snapshot像Parabon声称的那样有效。他说,警方也没有一种严格的方法来证明Snapshot的个人资料与他们的嫌疑人相符。
在Parabon将DNA表型增加到其投资组合的同时,包括Verogen和德克萨斯州休斯顿的商业DNA测试公司FamilyTreeDNA在内的其他公司开始用法医基因谱系进行试水。去年12月,Verogen宣布已经收购了GEDMatch,GEDMatch现在145万份DNA图谱中有28万份选择了警方搜查。首席执行官布雷特·威廉姆斯(Brett Williams)表示,Verogen认识到GEDMatch是法医基因谱系的关键,并希望保护公司的访问权限。这对Parabon和数百万私人GEDMatch用户意味着什么还有待观察,但威廉姆斯表示,他致力于在隐私和安全之间取得平衡。“你有隐私权。你也有权不被谋杀或强奸,“威廉姆斯说。然而,今年7月,GEDMatch遭到黑客攻击,用户的选择退出设置被覆盖了几个小时,可能会在未经他们同意的情况下将他们的数据暴露在执法部门的搜索之下。Verogen在一份声明中表示,它已经关闭了GEDMatch,“直到我们完全确定用户数据受到保护,不受潜在攻击”。
也有人试图通过官方渠道获取用户的个人资料。佛罗里达州奥兰多的一名侦探去年10月宣布,他已获得搜查令,可以使用所有GEDMatch档案试图从嫌疑人留下的DNA中寻找亲属。今年2月,家谱公司先祖成功地与宾夕法尼亚州的搜查令进行了抗争。威廉姆斯表示,他将与维罗根未来收到的任何逮捕令进行斗争。与此同时,美国司法部发布了临时指导方针,以帮助警方使用法医基因谱系,仅允许在强奸和谋杀等严重暴力犯罪中使用该技术,并且只有在用尽其他线索后才允许使用该技术。值得注意的是,该文档指定了t
葡萄牙布拉加米尼奥大学的社会学家海伦娜·马查多并不反对执法部门使用遗传家谱或DNA表型,但她表示,她担心将家谱与犯罪联系起来的工作可能会导致对某些家庭或民族的偏见。“这可能会强化这样一种观点,即某些家庭的犯罪率更高,”她说。过分强调基因和犯罪之间的联系意味着研究人员可能不太可能关注导致违法的社会和经济因素。
Armentrout和Kayser都表示,DNA技术可以通过提供具体证据来支持目击者的描述,从而帮助减少警方的偏见,而DNA表型分析可以通过向警方提供关于潜在嫌疑人外表的更多细节来减少种族定性。
但是阿姆斯特丹大学的社会学家Amake M‘charek说,这种想法是天真的,特别是考虑到警察对少数族裔的暴行的发生率。“如果我们不了解这个人,我们看到的往往就是种族,”她说。
莫罗说,M‘charek的担忧并不是没有根据的:这些技术已经被用来瞄准和歧视少数群体的人。美国国土安全部1月份宣布,其移民和海关执法部门(ICE)启动了一项试点计划,收集移民在押人员的DNA,并将结果序列上传到联邦调查局(FBI)的官方法医DNA数据库,即联合DNA索引系统(CODIS)。继去年宣布国土安全部将使用“快速DNA技术”检测申请庇护的家庭是否是亲属之后,这一举措也加入了这一行列。(ICE没有回复记者的置评请求。)。
在中国西北部,官员们正在利用基因血统来识别维吾尔少数民族的成员。2017年7月,作为中国全民健康计划的一部分,政府开始收集新疆维吾尔自治区12岁至65岁每个人的虹膜扫描、指纹和DNA。该计划受到了人权组织的批评。纽约非政府组织人权观察(Human Rights Watch)从新疆发来的报道称,到目前为止,已有100多万维吾尔族人被关押在拘留营。“当你给任何权威提供如此重要的信息,并对个人施加如此强大的杠杆作用时,你就开始。
.