当Google的人工智能变得恐同

2020-12-17 09:18:48

Warning: Can only detect less than 5000 characters

Freshfruit在Facebook平台上也遇到了类似的问题;他们的算法封锁了我们在Facebook和Instagram上的网站(以及相同的躯干图像),导致我们所有Facebook内容被删除。这些内容中的大部分内容都已经过审核并批准可以在Facebook Ads Manager中运行,但是其算法将Freshfruit编码为“垃圾邮件”。经过nearly回曲折的过程,我们花了将近一个月的时间,使人们能够观察到没有问题,并在几分钟之内恢复了我们的内容。给出的原因是它是一个“误报”标志。与Google不同,Facebook提供了人员升级点来解决此问题。

YouTube上有许多关于LGBTQ内容创建者的报道,他们面临类似的问题,这与它的算法和政策有关。 YouTube和Google均由其母公司Alphabet拥有。在GlitterBombTV的共同创始人Celso Dulay和Chris Knight的已婚夫妇的带领下,12位LGBTQ内容创作者起诉该技术公司以歧视,声称该公司的机器学习算法禁止,彻底阻止了他们的发布或广告内容,或使其货币化,或导致了他们其产生广告收入的能力受到财务损害。该诉讼指控Google的算法及其人工审核者系统歧视了YouTube频道,该频道的标题中包含“同性恋”,“反式”或“双性恋”等字眼。对于许多人来说,这意味着他们的内容不再显示在YouTube的“探索”页面中,或者不再被YouTube的推荐引擎与类似视频一起推荐。

该案的主要原告还试图宣传他们的新YouTube节目GNews – E的同性恋版本!网络的谈话汤。在尝试通过Google AdWords投放有关圣诞节“节庆”节目和阵容的广告来吸引观众之后,他们的广告被标记为有问题。在第五次向Google AdWords的呼叫中心询问为什么拒绝了第9条广告(骑士记录并接受了Freshfruit的收听)之后,他们被告知其内容被标记为“令人震惊”并违反了Google的政策。电话中的主管向他们解释说,他本人已经审查并且认为没有问题的广告不符合Google的标准,这不是因为其实际内容,而是因为该节目是同性恋节目,并且被视为“性”,尽管这与性无关,也没有性暗示。

杜莱说:“无论您走到哪里,我们都碰壁,我们遇到了这些障碍。” “这不仅令人沮丧,反而削弱了人们的收入。这使我们无法触及听众。人们现在说他们再也找不到我们了。在此之前,我们与许多人打过交道,他们说我们是社区的试金石,因为他们住在一个没有东西的地方。因此,我们使他们能够访问信息以及所有其他内容。因此,由于这种减少,我们建立了自己的网站,因为即使YouTube出现了很多问题,我们仍然希望继续进行演出。”

斯蒂芬妮·弗罗施(Stephanie Frosch)是LGBTQ + YouTuber的订阅者,拥有约370,000名订阅者,她还与诉讼相关联。她对Freshfruit表示,她每月的收入几乎不到100美元,而2009年的年收入为23,000美元。

Frosch说:“这是第一次发生的时候,我和其他几位创作者一起被邀请进入YouTube(办公室),这些创作者来自特定领域,从游戏到育儿再到YouTube不同方面的美食家。我们都对新算法及其对我们货币化的影响表示了担忧。 YouTube当时的抗辩理由是:“不仅歧视您,还歧视其他人。”就像,等等,这使情况变得更糟。因此,不仅是酷儿创作者。即使是有色人种也一直在表达自己的意见,即他们上传的内容是针对这个国家持续存在的种族主义进行公开对话时,他们经常被贬低。 YouTube坚决地说“我们有同志代表和黑人代表”,但前提是我们不谈论他们在社会中所经历的苦难。

为了回应他们的要求,YouTube的首席执行官Susan Wojcicki在接受Alfie Deyes的视频采访时表示:“我们不会自动将LGBTQ内容货币化。我们非常努力地确保我们的系统公平。我们拥有ML(机器学习)公平性倡议,以确保我们的算法和机器工作方式是公平的。”

该诉讼目前与北加利福尼亚的美国地方法院法官Virginia DeMarchi一起审理。 Google的论点是,其算法受《通信规范法》第230条的保护。他们希望法院将社交媒体网站视为发布商,而不是“互动计算机服务”,因为这些网站不受审查制度指控的法律影响。他们坚持认为,作为这样的提供者,无论删除该材料是否受到宪法保护,都不会因Google认为“淫秽,淫荡,淫荡,淫秽,肮脏,过度暴力,骚扰或其他令人反感的内容而被起诉”是以“真诚”完成的。在涉及特朗普总统和推特的审查制度案件中,美国司法部同时为该法规进行辩护,同时对同一论点提出异议。总统通过行政命令撤销了第230条,称Twitter可以视为发布者。杜莱(Dulay)和奈特(Knight)的律师正在使用总统的行政命令来捍卫自己的职位。相同的律师代表四名黑人YouTube创作者,对Google提起类似诉讼。

仅在与Google共享后,我们计划在经过两次尝试后就我们的经历进行报告,我们才得到他们新闻办公室的回应,指出我们先前的消息已经进入了他们的垃圾文件夹。在不到24小时的时间内,我们的AdSense帐户已获得批准-我们未对网站进行任何更改。当被问到造成封锁的原因是什么时,他们的出版商政策教育负责人约翰·布朗说:“我们的调查发现这是一个错误,并且对使用的一些图像进行了标记,这些图像标记错误。我们的执法人员从未标记过文章的内容,也没有发现其违反政策。”当谈到如何标记图像时,他说:“自动审查以及最初的人工审查都将图像标记为色情。”

布朗说,他无法提供他们的审查程序的详细信息,也没有回答我有关人类审查员是否没有注意到“过度举报”的问题,但表示“性/成人内容/主题往往比灰色案件更多。许多其他政策,有时上下文是关键。通过所有人工审核,如果您有多个人在看相同的灰色区域内容/图像,则可以生成不同的响应。”

当被问及审核小组是否包括LGBTQ个人或为建立多样化的审核小组而做出了哪些努力时,他说:“我不会对外透露有关我们团队成员的任何数据。但是,我们已经建立了一个外部网站来介绍我们的多元化工作,您可以进行审查。”

他总结说:“我们的政策和执行旨在达到微妙的平衡–我们希望为发布商提供参与和报告主题及其观点的空间,同时确保我们在广告客户合作伙伴中赢得信任。结果,我们确实看到了这样的过度标记。我们正在与团队紧密合作,以减少此类情况的发生。”

还有其他一些报道的事件表明Google的机器学习将其弄错了。 Google因将马丁·路德·金(Martin Luther King)在马丁·路德·金纪念日(Martin Luther King Day)发布伯明翰监狱的信而被大西洋化,因为它违反了含有“ N”字的“危险或贬损内容”政策。 Slate Media表示,涉及白人至上,奴隶制和仇恨团体等主题的10多篇文章因引用了种族诽谤,包括一本书的书名,也因同样的违规而被废除。 Buzzfeed从有关种族和LGBTQ的文章中获利,其中包括一系列有色人种的先锋酷儿。

在这种情况下,社交媒体(主要是YouTube)上出现了新纳粹和极端主义内容的泛滥。虽然Google和Facebook都在努力在2019年删除极端主义内容,但Google允许其中的一些人保持原状和未经审查的一年,这与白人民族主义者理查德·斯宾塞(Richard Spencer),KKK David Duke的前领导人以及国家政策研究所(白人至上主义者)小组由Spencer经营。 Spencer和Duke的帐户现已被禁止。新纳粹内容仍在继续剥夺YouTube阻止它们的能力,而且更有可能被货币化。 PewDiePie是YouTube上最受欢迎的用户,拥有超过1亿的追随者,其中大多数是印象深刻的青少年,其过去一直在倡导另类权利文化,例如宣传反犹太YouTube频道和开玩反犹太笑话,许多观察者发现这令人不安。

免得有人说以上内容表明,Google的机器学习算法并非歧视LGBTQ内容,而是过于保守和上下文无关,我建议它们并不互相排斥。别忘了他们邀请了人工审核员。 Google机器学习模型中存在偏见的程度与其评估的数据来源,数据集的内容以及模型本身的训练一样有偏见,其中可能包括人为偏见的影响。

就在上周,由于Google高层要求收回她计划于明年3月在计算机科学会议上发表的研究论文的压力,谷歌的明星人工智能伦理研究者Timnit Gebru博士被辞职。在其中,她强调了Google大型语言处理模型中的风险,这些模型具有来自富裕国家或地区的具有更多代表性的数据集,而这些国家或地区的互联网访问量比没有富裕的国家或人群更多。这导致AI生成的语言更加同质。

她讨论了这一问题的存在以及为什么它可能会带来很大问题的一个方面是,大型语言模型严重依赖于从互联网收集的文本和数据。麻省理工学院的一位高级AI记者说,除了可以接受偏见的挑战外,他还可以访问被审查的研究论文。他说,谷歌的AI冒着种族主义,性别歧视和其他辱骂性语言的风险。通过#MeToo和Black Lives Matter运动中出现的反种族主义或反性别主义的在线流行率较低的较新词汇的消耗和细微差别进行标准化。换句话说,归一化的术语可能会被Google Brain(其人工智能)忽略,非归一化的词可能不会,这可能会影响很多事情,包括可以在搜索中找到或推荐的内容,如何审查新的内容创建者是否违反其政策,以及他们如何阻止网络中已有的内容,具体取决于这些语言模型的应用方式。这就提出了一个问题,即模型中是否可能存在过分表示异规范性内容的类似偏见,而该偏见可以以不包含LGBTQ内容为代价进行标准化。试图到达格布鲁以确认这一理论的尝试没有得到答案。

Freshfruit可能不科学,观察到其他主流新闻网站的广告呼叫,其内容与在freshfruitmag.com上更有可能被视为有问题的内容有关-有时主题相同。 “广告调用”是指用户的浏览器从广告网络(在这种情况下,是从Google Ad Exchange或AdSense)向广告网络发出广告请求,并由广告服务器(Google广告管理系统)投放到网页上的情况。自然,我们发现Google没什么问题通过Freshfruit检查的网站获利。我们甚至在一篇有关引诱已婚父亲的文章中找到了Google的广告,其中该文章涉及引诱已婚父亲的文章,其中多次提及男性生殖器的语。我们在Slate的Dear Prudence建议专栏上找到了Google广告,该专栏涵盖了从吸烟大麻,性行为和勃起有关的话题。 Google可以通过类似于《新鲜水果》中有关喜欢看同性恋色情片的女性的Vice媒体故事来获利,也可以通过Vice的另一篇有关帮助从一个有天赋的年轻男子中培养色情明星的故事来获利。

可以争辩说,这不是明显的偏见示例,因为所使用的关键字和图像的混合方式虽然在主题上是相同的,即使它们在主题上是相同的,但它们是不同的。目前尚不清楚Freshfruit社论中的哪些内容令人反感,因为它们并未共享具体细节—但这引发了一个关于Google算法和数据输入的一致性的问题,即使删除了所有可能被认为违反的内容,Freshfruit仍然无法通过审核过程。还有钱的问题。虽然Google在针对他们的诉讼中阻止了YouTube原告的广告,但他们还在其他LGBTQ内容创建者中投放广告,该广告的前1%的订阅者和观看者都犯了与原告论点中所述类似的违法行为,这表明也许视而不见

......