大多数人工智能仍然基于人劳动的基础。在AI算法内的同行,您将找到使用由人工军队策划和标记的数据构建的内容。
现在,Facebook已经表明了一些AI算法如何学会做有用的工作,远远不那么人的帮助。该公司建立了一种学习的算法,可以从标签的帮助下识别图像中的对象。
Facebook算法称为Seer(用于自我监督),从Instagram刮掉超过10亿张图像,决定本身看起来都是相似的。例如,用晶须,毛皮和尖耳的图像收集到一堆中。然后算法给出了少量标记的图像,包括一些标记的“猫”。然后,它能够识别图像以及使用每个对象的数千个标记的示例训练的算法。
“结果令人印象深刻,”普林斯顿大学助理教授Olga Russakovsky说,他们专注于AI和计算机愿景。 “让自我监督的学习工作是非常具有挑战性的,并且这个空间的突破具有重要的下游后果,以改善视觉认可。”
Russakovsky表示值得注意的是,Instagram图像没有被挑选,以更轻松地制作独立的学习。
Facebook' yann Lecun表示,Facebook的研究是一种被称为“自我监督学习”的AI方法的标志性,称为“自我监督的学习”。
Lecun开创了被称为深度学习的机器学习方法,涉及将数据馈送到大型人工神经网络。大约十年前,深入学习被出现为更好的方法来编程机器,以便做各种有用的东西,例如图像分类和语音识别。
但是Lecun表示,通过喂食它的标记数据,需要“培训”一种算法的传统方法,根本不会扩展。 “我一直在倡导这一切的自我监督学习的整个想法,”他说。 “长期来看,AI的进步将来自只需一天观看视频并像婴儿一样学习。”
Lecun表示,自我监督的学习可以有许多有用的应用程序,例如学习阅读医学图像,而无需标记这么多扫描和X射线。他说,类似的方法已经用于自动生成用于Instagram图像的HashTags。他说,可以在Facebook上使用SEER技术,以匹配广告,或帮助筛选不良内容。
在调整深度学习算法方面,Facebook的研究建立在稳步发展中,使其更加高效和有效。自我监督的学习以前已被用于将文本从一种语言转换为另一语言,但它比单词更难以应用于图像。 Lecun表示,研究团队为算法开发了一种新的方式,即使图像的一部分被改变,学会识别图像的算法。
Facebook将释放Seer背后的一些技术,但不是算法本身,因为它是使用Instagram用户数据训练的。
导致麻省理工学院的计算感知和认知实验室的Aude Oliva表示,这种方法"将允许我们采取更雄心勃勃的视觉认可任务。“但是,奥利太亚表示,尖端AI算法的纯粹的大小和复杂性,如Seer,它可以具有数十亿或万亿的神经连接或参数 - 许多具有可比性性能的传统图像识别算法 - 也存在问题。这种算法需要大量的计算能力,紧张可用的芯片供应。
Alexei efros是UC Berkeley教授的,Facebook论文是一种良好的演示,他认为他认为对推进AI的机器非常重要,通过使用“Gargantuan的数据”来学习自己。他说,与今天AI的大多数进展一样,它建立在Facebook以及学术界和工业中的同一团队中出现的一系列其他进展。