Deepfakes正在成为炙手可热的新型企业培训工具

2020-08-05 03:55:42

本月，广告巨头WPP将向全球数万名员工发送不同寻常的企业培训视频。演讲者将用接受者的语言发言，并以他们的名字称呼他们，同时解释人工智能的一些基本概念。视频本身将有力地展示人工智能的功能：面孔和它说的话将由软件合成。

WPP不会这样收费，但其合成培训视频可能会被称为Deepfakes，这是一个宽松的术语，适用于使用人工智能生成的看起来真实的图像或视频。虽然最出名的是骚扰、色情或欺骗的工具，但图像生成人工智能现在正被大公司用于企业培训等无痛的目的。

WPP用伦敦初创公司Synthesia的技术制作的虚幻培训视频并不完美。WPP首席技术官斯蒂芬·比勒托瑞斯(Stephan Pretorius)表示，主持人演讲的韵律可能会被取消，这是向“连线”展示的视觉流畅的早期剪辑中最刺耳的缺陷。但他说，对许多个人进行个性化和本地化视频的能力，使得视频比通常的公司票价更具吸引力。“这项技术很快就变得非常好，”比勒托瑞斯说。

深伪风格的制作也可以既便宜又快捷，新冠肺炎的限制放大了这一优势，这些限制使得传统的视频拍摄变得更加棘手和风险更高。比勒托瑞斯说，一场全公司范围的内部教育活动可能需要为WPP的全球员工提供20种不同的剧本，每个剧本的制作成本都高达数万美元。他说：“有了Synthesia，我们就可以拥有多样化的头像，用你的名字、你的机构和你的语言说话，整个系统的成本可以达到10万美元。”在今年夏天的培训活动中，语言仅限于英语、西班牙语和普通话。比勒陀利亚希望今年向5万名员工分发20个模块，每个模块约5分钟。

深度假货一词来自Reddit的用户名，他或她在2017年发布了一系列利用机器学习修改的色情片段，将好莱坞女演员的脸包括在内。他们的代码在网上发布，现在任何感兴趣的业余人士都可以使用各种形式的人工智能视频和图像生成技术。Deepfake已经成为骚扰活动人士的工具，也是担心政治虚假信息的议员和社交媒体高管担心的一个原因，尽管它们也被用来娱乐，比如把尼古拉斯·凯奇(Nicolas Cage)插入他没有出现的电影中。

用来挑逗、骚扰或娱乐的深伪通常会有明显的泄露故障。初创公司现在正在制作人工智能技术，可以生成视频和图像，能够作为传统公司镜头或营销照片的替代品。它的出现正值合成媒体和人变得越来越主流的时候。知名人才经纪公司CAA最近与Lil Miquela签约，Lil Miquela是一位由计算机生成的Instagram影响力人物，拥有200多万粉丝。

Rosebud AI专门制作电子商务或营销中使用的那种光滑图像。去年，该公司发布了一组2.5万张从未存在过的人的模特照片，以及可以将人造面孔转换为任何照片的工具。最近，它推出了一项服务，可以将人体模型上拍摄的衣服放到虚拟但看起来真实的模型上。

Rosebud首席执行官兼创始人李丽莎(Lisha Li)表示，该公司可以帮助资源有限的小品牌产生更强大的图像组合，以更多样化的面孔为特色。“如果你是一个想要讲述视觉故事的品牌，你过去必须有一个庞大的创意团队，或者购买库存照片，”她说。现在你可以利用算法来制作你的投资组合了。

JumpStory是丹麦霍伊布耶格的一家库存照片初创公司，它已经试验了Rosebud的技术。它已经围绕内部的机器学习技术建立了一项业务，试图管理一个只包含视觉上最引人注目的照片的图书馆。使用Rosebud的技术，JumpStory测试了一项功能，客户只需点击几下，就可以改变库存照片中的面孔，包括改变一个人的明显种族，否则这项任务是不切实际的，或者需要仔细的Photoshop工作。

JumpStory首席执行官乔纳森·洛(Jonathan Low)表示，该公司选择不推出这一功能，而是更愿意强调其图像的真实性。但这项技术令人印象深刻。“如果是肖像画，效果非常好，”Low说。他说，当面孔在图像中不那么突出时，比如在全景照片中，效果通常不会那么好。

为WPP的Deepfake项目提供支持的伦敦初创公司Synthesia为埃森哲(Accenture)和SAP等企业客户制作了以合成谈话负责人为特色的视频。去年，它帮助大卫·贝克汉姆(David Beckham)似乎用几种语言发表了关于疟疾的公益广告，包括印地语、阿拉伯语和基尼亚万语，卢旺达数百万人都说这种语言。

Synthesia首席执行官兼联合创始人维克多·里帕贝利(Victor Riparbeli)表示，合成视频的广泛使用是不可避免的，因为消费者和公司对视频的需求比传统制作可能满足的更大。“我们的意思是，让我们把相机从等式中去掉，”他说。里帕贝利说，自从新冠肺炎关闭了许多视频拍摄，并迫使一些公司推出新的员工教育和培训计划以来，人们对他的技术的兴趣有所增加。

用Synthesia的工具制作视频只需要几秒钟。从列表中选择化身，键入脚本，然后单击标记为“生成视频”的按钮。该公司的头像是以真人为基础的，这些人根据他们的图像制作了多少镜头来收取版税。在消化了一个人的一些真实视频后，Synthesia的算法可以生成新的视频帧，使他们的面部动作与合成语音的文字相匹配，合成语音可以用二十多种语言创建。客户可以通过提供一个人的几分钟样片来创建他们自己的化身，还可以定制他们的环境和声音。

里帕贝利和其他致力于深度假货商业化的人表示，他们正在谨慎行事，而不仅仅是急于变现。Synthesia已经在网上发布了道德规则，并表示它会审查客户和他们的剧本。它需要得到一个人的正式同意，然后才会合成他们的外表，而且不会触及政治内容。Rosebud有自己的道德声明，但不太详细，承诺打击合成图像的负面使用和影响。

Rosebud的首席执行官李说，她的技术应该利大于弊。她说，在不增加生产预算的情况下，帮助更多的人参与竞争，应该会鼓励扩大美容标准。她的技术可以生成非二元性别的模型，也可以生成不同种族的模型。“与我合作的很多用户都是少数族裔品牌所有者，他们希望创造多样化的形象来代表他们的用户基础，”李彦宏表示。在获得伯克利分校(Berkeley)统计学和机器学习博士学位之前，他在副业做了10多年的模特，并作为一名风险投资家工作。

亚利桑那州立大学(Arizona State University)人工智能教授苏巴拉奥·坎巴汉帕蒂(Subbarao Kambhampati)表示，这项技术令人印象深刻，但他想知道，一些Rosebud客户是否会使用多样化的合成模型，而不是来自少数族裔社区的真人。“这可能会让我们在不改变现实的情况下，在表现上产生一种虚假的成就感，”他说。

随着合成图像进入公司主流，大品牌及其广告公司将极大地影响人们体验这项技术的方式。WPP的比勒托瑞斯表示，他的公司正在探索人工智能合成图像的许多用途，到目前为止，他的作品包括伦勃朗风格的肖像和数字制作的模型，与真人难以区分。他表示：“我们在技术上可以做到这一点，但在将其推向市场方面进展缓慢。”该公司的总法律顾问正在为合成模型和其他图像制定一套道德标准，包括何时以及如何披露某些事情并不是它看起来的那样。

👁如果处理得当，人工智能可以使警务更加公平。另外：获取最新的人工智能新闻。

✨使用我们齿轮团队的最佳选择优化您的家庭生活，从机器人吸尘器到价格实惠的床垫再到智能扬声器

https://www.wired.com/story/covid-drives-real-businesses-deepfake-technology/

tags users