上周,谷歌宣布了一项计划,“建立一个更加私人的网络”。坦白说,公告栏一团糟。跟踪超过⅔的用户行为的公司表示:“在我们所做的所有事情中,隐私对我们来说都是至关重要的。”
Google不仅将其对定向广告的承诺提高了一倍,而且还提出了可笑的说法,即阻止第三方cookie(迄今为止是网络上最常见的跟踪技术以及Google选择的跟踪方法)会损害用户隐私。它辩称,通过取消使跟踪变得容易的工具,Apple和Mozilla等开发人员将迫使跟踪器诉诸于“不透明的技术”,例如指纹识别。当然,在该论点中遗失的事实是Safari和Firefox的制造商已表现出对关闭指纹识别的认真承诺,并且两种浏览器都朝着这个方向取得了实质性进展。此外,“隐私沙箱”建议中的关键部分是Chrome浏览器自己的(延迟的)计划,以停止指纹识别。
但是隐藏在虚假的等价和隐私保护背后的是一组真正的技术建议。有些是真正的好主意。其他人则可能是无法减轻的隐私灾难。这篇文章将探讨Google在新的“隐私沙箱”框架下的具体建议,并讨论它们对网络未来的意义。
首先是“ Trust API”。该提议基于Privacy Pass,这是CAPTCHA的一种保护隐私和减少沮丧感的替代方法。用户无需使用Trust API即可在整个Web上填写CAPTCHA,而是只需填写一次CAPTCHA,然后使用“信任令牌”来证明自己将来是人类。令牌是匿名的,并且不能相互链接,因此它们不会帮助Google(或其他任何人)跟踪用户。由于Google是世界上最大的CAPTCHA提供商,因此它的采用Trust API对于残障用户,Tor用户以及任何讨厌单击店面颗粒状图片的人来说都是一个巨大的胜利。
Google提议的指纹“隐私预算”也令人兴奋。浏览器指纹识别是一种收集有关特定浏览器实例的足够信息以尝试唯一标识用户的实践。通常,这是通过将易于访问的信息(如用户代理字符串)与来自功能强大的API(如HTML canvas)的数据进行组合来实现的。由于指纹识别是从其他有用的API中提取识别数据的,因此如果不对合法的Web应用程序施加束缚就很难停止。作为一种解决方法,Google建议限制网站可以通过潜在敏感API访问的数据量。每个网站都有一个“预算”,如果超出预算,浏览器将切断其访问权限。大多数网站不会使用HTML画布之类的东西,因此它们不受影响。需要访问功能强大的API(例如视频聊天服务和在线游戏)的网站将能够要求用户获得“超出预算”的许可。细节决定成败,但隐私预算是一个有前途的框架,可用来打击浏览器指纹。
不幸的是,这就是好东西的结局。 Google的其他建议从平庸到彻头彻尾的危险不等。
沙盒中最充实的建议也许是转化评估API。这是在试图解决一个古老的在线广告问题:您如何知道点击广告的人最终是否购买了广告产品?目前,第三方Cookie承担了大部分工作。第三方广告商代表营销商投放广告并设置Cookie。营销人员在自己的网站上包含一小段代码,该代码段使用户的浏览器将Cookie集合更早地发送回广告商。广告客户知道用户何时看到广告,并且知道同一用户以后何时访问营销者的网站并进行购买。通过这种方式,广告客户可以将广告印象归因于几天或几周后发生的网页浏览和购买。
如果没有第三方Cookie,则归因会变得更加复杂。即使广告客户可以观察网络上的访问量,而又无法将广告展示次数链接到网页浏览量,也不会知道其广告系列的效果如何。苹果公司开始使用智能跟踪预防(ITP)来打击广告客户对Cookie的使用后,还提出了一种保护隐私的广告归因解决方案。现在,谷歌正在提出类似的建议。基本上,广告客户将能够使用元数据标记广告,包括目标URL,报告URL和额外的“展示数据”字段(可能是唯一ID)。每当用户看到广告时,浏览器就会将其元数据存储在全局广告表中。然后,如果用户将来访问目标URL,则浏览器将向报告URL发出请求,以报告广告已“转换”。
从理论上讲,这可能还不错。该API应该允许广告客户得知有人看到了自己的广告,然后最终登陆了该广告页面。这样就可以提供有关广告系列效果的原始数字,而无需单独识别信息。
问题是印象数据。苹果公司的提议允许营销人员在“广告系列ID”中存储6位信息,即1到64之间的数字。这足以区分不同产品的广告或使用不同媒体的广告系列。
另一方面,Google的ID字段可以包含64位信息-一个介于1到18亿五千万之间的数字。这样一来,广告客户就可以为其提供的每个广告展示都附加一个唯一的ID,并有可能将广告转化与单个用户联系起来。如果用户与网络上同一广告客户的多个广告互动,则这些ID可以帮助广告客户建立用户浏览习惯的资料。
更糟糕的是Google提出的“联合学习群体”(“ FLoC”)建议。在幕后,FLoC基于Google精巧的联合学习技术。基本上,联合学习允许用户通过一次共享一点信息来构建自己的本地机器学习模型。这使用户无需立即共享所有数据即可获得机器学习的好处。可以将联合学习系统配置为使用安全的多方计算和差分隐私,以确保可验证的原始数据是私有的。
FLoC的问题不是过程,而是产品。 FLoC将使用Chrome用户的浏览历史记录进行集群。在较高级别上,它将研究浏览模式并生成相似用户的组,然后将每个用户分配到一个组(称为“群”)。在该过程结束时,每个浏览器将收到一个“群名称”,以将其标识为某种Web用户。根据Google的建议,用户可以与网络上与之互动的每个人共享其群名称(作为HTTP标头)。
总之,这不利于隐私。羊群的名字实际上就是行为的信用评分:数字额头上的纹身,可以简要概括您是谁,喜欢什么,去哪里,买什么以及与谁联系。羊群名称可能对用户来说是难以理解的,但可能会向第三方透露难以置信的敏感信息。跟踪者将能够根据需要使用这些信息,包括增强自己的用户幕后资料。
谷歌表示,浏览器可以选择将浏览历史记录中的“敏感”数据排除在学习过程之外。但是,正如公司本身所承认的那样,不同的数据对不同的人敏感。一种千篇一律的隐私保护方法将使许多用户面临风险。此外,许多网站目前选择不与第三方跟踪器合作,以尊重用户的隐私。 FLoC将抢劫这些网站这样的选择。
此外,对于已经能够观察网络活动的人来说,群名称将更有意义。拥有大型跟踪网络的公司将能够得出自己的结论,即特定群体的用户的行为方式。歧视性广告客户将能够识别并过滤掉代表弱势群体的羊群。掠夺性贷方将了解哪些羊群最容易出现财务困难。
FLoC与隐私保护技术相反。如今,跟踪器会在网上跟踪您,在数字阴影中躲藏,以便猜测您可能是什么样的人。在Google的未来,他们将坐下来放松,让您的浏览器为他们完成工作。
那把我们带到了PIGIN。虽然FLoC承诺将每个用户与一个不透明的组标识符进行匹配,但PIGIN将让每个浏览器跟踪它认为其用户所属的一组“兴趣组”。然后,每当浏览器向广告商发出请求时,它都可以发送用户“兴趣”列表,以实现更好的定位。
Google的提案为讨论PIGIN的隐私风险预留了很多空间。但是,它所讨论的保护措施却远远不够。作者建议使用加密技术来确保一个兴趣组中至少有1,000个人,然后再公开该用户的成员资格,并将一次披露的最大兴趣数量限制为5个。仔细检查:5个不同的组(每个组仅包含数千人)的成员资格将足以唯一地标识网络上的很大一部分用户。此外,恶意行为者将能够以多种方式对系统进行游戏,包括了解用户在敏感类别中的成员身份。该提案虽然提及使用差异化隐私,但并未开始描述具体如何减轻PIGIN带来的无数隐私风险。
Google吹捧PIGIN是赢得透明度和用户控制的胜利。这在一定程度上可能是正确的。知道广告主用来定位特定广告的信息是一件很高兴的事,并且能够逐一选择退出特定的“兴趣组”会很有用。但是像FLoC一样,PIGIN并没有解决在线跟踪当前无法正常运行的问题。取而代之的是,它将为跟踪器提供大量新的信息流,可用于构建或扩展自己的用户配置文件。从浏览器中删除特定兴趣的功能可能不错,但是它并不能阻止已收集信息的每个公司存储,共享或出售该数据。此外,PIGIN的这些功能可能会成为大多数用户无法触摸的另一个“选项”。默认值很重要。在Apple和Mozilla努力使浏览器开箱即用的同时,Google继续发明新的侵犯隐私的做法,供用户选择退出。
如果“隐私沙箱”实际上无法为用户提供帮助,那么Google为什么要提出所有这些更改?
Google可能会看到风向。 Safari的Intelligent Tracking Prevention和Firefox的Enhanced Tracking Protection严重限制了第三方跟踪器对数据的访问。同时,用户和立法者继续要求Big Tech提供更强大的隐私保护。尽管Chrome仍然主导浏览器市场,但Google可能会怀疑无限访问第三方cookie的日子已经到了。
结果,谷歌显然决定在两个方面捍卫其商业模式。首先,它一直在争辩说第三方cookie实际上是可以的,并且Apple和Mozilla这样的公司会限制跟踪器对用户数据的访问,最终会损害用户隐私。这种说法是荒谬的。但是不幸的是,只要Chrome仍然是世界上最受欢迎的浏览器,Google就能一手掌握指示cookie是否仍然是跟踪大多数用户的可行选择。
同时,谷歌似乎在对赌。转化衡量,FLoC和PIGIN的“隐私沙盒”提案各自旨在替代将第三方Cookie用于目标广告的现有方式之一。 Google正在集思广益,在第三方Cookie之后的世界中继续投放目标广告。如果将Cookie用作弹出广告,则Google的定位业务将照常继续。
沙盒与您的隐私无关。这与Google的底线有关。归根结底,Google是一家恰巧制造浏览器的广告公司。