教授AI系统以了解视频中发生的内容,作为人类的可能性是最挑战的挑战之一 - 在机器学习世界中最大的潜在突破。今天,Facebook宣布了一项新的倡议,它希望在这种后续工作中提供优势:在Facebook用户的公开视频上培训其AI。
访问培训数据是AI最大的竞争优势之一,并通过从数百万和数百万用户收集此资源,如Facebook,Google和Amazon等科技巨头已经能够在各个领域进行伪造。虽然Facebook已经训练了从Instagram收集的数十亿图像的机器视觉模型,但它以前宣布过类似的视频理解项目。
“我们更广泛地努力建造像人类所做的机器”
“通过从几乎每个国家和数百种语言的全球公共可用视频的全球流学习,我们的AI系统不会提高准确性,而且还适应我们快速移动的世界,并认识到不同文化和地区的细微差别和视觉提示,”公司在博客中。该项目,标题为视频,也是Facebook的一部分,也是Facebook的一部分,更广泛地建造了像人类所做的机器。“
Facebook说,所得到的机器学习模型将用于创建新的内容推荐系统和审核工具,但在将来可能更加多。可以理解视频内容的AI可以向Facebook前所未有地洞察用户的生活,允许他们分析他们的爱好和兴趣,品牌和衣服的偏好,以及无数的其他个人信息。当然,Facebook已经通过当前的广告目标操作访问了这些信息,但能够通过AI解析视频会将一个令人难以置信的丰富(和侵入)的数据源添加到其商店。
Facebook对未来的AI模型计划对用户视频培训的未来计划含糊不清。该公司讲述了这些模型可以放在一些用途中,从标题视频创建高级搜索功能,但没有回答关于它们是否用于收集广告目标信息的问题。同样,当被问及用户不得不同意拥有他们的视频,以便培训Facebook的AI,或者他们可以选择退出,但公司才通过注意到其数据策略表示用户的上传内容可用于“产品研发”。 “ Facebook还没有回答问题,究竟询问将收集多少视频,以培训其AI系统或如何通过公司的研究人员进行监督的访问。
然而,在其博客文章宣布该项目中,社交网络确实指向一个未来,投机用途:使用AI检索由智能眼镜捕获的“数字存储器”。
Facebook计划今年的某个时候释放一副消费智能眼镜。有关该设备的详细信息含糊不清,但它可能是这些或未来的眼镜将包括集成摄像机,以捕捉佩戴者的观点。如果可以培训AI系统以了解视频的内容,那么它将允许用户搜索过去的录音,就像许多照片应用程序允许人们搜索特定的位置,对象或人员。 (这是偶然的信息,通常由培训在用户数据上培训的AI系统索引。)
由于智能眼镜录制视频“成为常态”,“Facebook说:”人们应该能够回忆起他们大量的数字记忆的特定时刻,就像他们捕获它们一样简单。“它给出了一个用户用短语进行搜索的用户的例子“每次向我唱歌生日快乐到奶奶,”之前是服务的相关剪辑。正如公司注释所示,这样的搜索要求AI系统在数据类型之间建立连接,教他们“将”快乐生日“与蛋糕,蜡烛,唱歌各种生日歌曲相匹配,更多。”就像人类一样,AI需要了解具有不同类型的感官输入的丰富概念。
展望未来,智能眼镜和机器学习的组合将通过将智能眼镜的佩戴者转向粗糙的CCTV摄像头,使其成为“WorldScraping” - 捕获了关于世界的粒度数据。由于在去年的报告中介绍了守护者的情况:“每次有人浏览超市时,他们的智能眼镜将记录实时定价数据,股票水平和浏览习惯;每次他们打开一份报纸时,他们的眼镜会知道他们读过哪些故事,他们看着他们看着他们的凝视徘徊的名人海滩图片。“
这是一个极端的结果,而不是研究杂志的大道,Facebook目前正在探索。但它确实说明了用智能眼镜配对高级AI视频分析的潜在意义 - 社交网络显然热衷于此。
相比之下,Facebook目前披露的新AI视频分析工具的唯一使用是相对平凡的。随着从今天学习视频的宣布,Facebook表示,它将基于其Tiktok-Clone卷轴的视频工作部署了新的内容推荐系统。 “流行的视频通常由与同一舞蹈移动的相同音乐组成,而是由不同的人创造和采取行动,”Facebook说。通过分析视频的内容,Facebook的AI可以向用户建议类似的剪辑。
但是,这种内容推荐算法并非没有潜在的问题。 MIT技术综述最近的一份报告强调了社会网络如何强调增长和用户参与已停止其AI团队完全解决算法如何传播错误信息并鼓励政治极化。由于技术审查文章说:“[机器学习]最大化参与的模型也有利于争议,错误信息和极端主义。”这在Facebook的AI伦理研究人员和公司最大化增长的信条之间存在冲突。
Facebook不是唯一追求先进的AI视频分析的大型技术公司,也不是唯一一个利用用户数据来做的。例如,谷歌维护了一个可公开访问的研究数据集,其中包含800万策策和部分标记的YouTube视频,以“帮助加速研究大规模视频了解”。搜索巨头的广告业务可能类似地受益于可以理解视频内容的AI,即使最终结果只是在YouTube中提供更多相关广告。
但是,Facebook认为它对其竞争对手具有一个特殊的优势。它不仅具有充分的培训数据,还可以将越来越多的资源推向称为自我监督学习的AI方法。
通常,当AI模型在数据上培训时,这些输入必须由人类标记:例如,标记图像中的对象或转录音频录制。如果您解决了验证消防栓或行人交叉的CAPTCHA,那么您可能会标记有助于培训AI的数据。但是,自我监督的学习与标签一起消失,加快培训过程,以及一些研究人员认为,由于AI系统教授自己加入小点,导致更深入和更有意义的分析。 Facebook对自我监督的学习如此乐观,它被称为“智慧的暗物质”。
该公司表示,其对AI视频分析的未来工作将专注于半和自我监督的学习方法,并且此类技术“已经改善了计算机视觉和语音识别系统”。通过Facebook的28亿用户获得了如此丰富的视频内容,跳过标签部分AI培训肯定是有道理的。如果社交网络可以教导其机器学习模式,无缝地了解视频,谁知道他们可能会学到什么?