人工智能(AI)对世界上的善做出了重大贡献。从减少污染到使用自动驾驶汽车使道路更安全,再到通过医疗大数据分析实现更好的医疗保健,人工智能仍有大量尚未开发的潜力。不幸的是,就像世界上的任何技术一样,人工智能可以被那些不那么高尚的人使用。
有一种基于人工智能的技术叫做“深度假冒”(深度学习和假冒相结合),它利用深度神经网络轻松地制作假视频,其中一个人的面孔叠加在另一个人的面孔上,这就是一种基于人工智能的技术。这些工具易于使用,即使对于没有编程或视频编辑背景的人也是如此。这项技术可以用来制作几乎任何人的攻击性视频,包括名人、政客和企业公众人物。在这个空前互联和即时通信的时代-新闻可以在几个小时内像病毒一样传播开来-这样的视频可能会对视频中的人以及相关社区的社会和文化心理造成巨大伤害。
Deepfakes就在市场上。但是,如果能够自动检测到这些视频,则可以减轻危害。还有什么比使用人工智能本身更好的方法来做到这一点呢?
虽然基于人工智能的深度假视频检测方法确实存在,但来自印度塔帕尔工程技术研究所和Indraprpara信息技术研究所的研究人员已经开发出一种新的算法,提高了准确性和精确度。他们的工作可能是寻求对抗我们今天所面临的众多信息需求中的一种的里程碑。
大体上,他们的方法由一个分类器组成,该分类器决定输入的视频是真实的还是(深度)假的。为了做出准确的决策,就像所有基于人工智能的应用程序一样,它们的算法必须首先进行训练。为此,研究人员首先创建了一个包含200个长相相似的不同政客组合的视频的数据集;其中100个是真实的,另外100个是使用Deepfac生成的。这些视频的一部分帧被标记并作为训练数据馈送到算法;其余的被用作验证数据集,以测试程序是否能够正确地捕获人脸交换的视频。
算法本身可以分为两个层次。在第一级,视频帧经过一些轻微的图像处理,例如重新缩放、缩放和水平翻转,为后续阶段做准备。第二级包括两个主要部分:卷积神经网络(CNN)和长短期记忆(LSTM)阶段。
CNN是一种特殊类型的神经网络,可以从连续的视频帧中自动提取特征。提取了什么特征以及它们是如何定义的,只有CNN知道。LSTM是一种递归神经网络,对于处理时间序列数据(在这种情况下,是连续的视频帧)特别有用。在比较原始视频和深度假视频时,LSTM网络很容易检测到后者的帧不一致。该算法仅使用大约两秒的视频素材就可以识别它们。
对这种新方法的性能进行了测试,并与其他现有的基于人工智能的深度假视频检测技术进行了比较。对于从本研究整理的视频数据集中检索到的181,608个真实和深度伪帧,该方法获得了较高的准确率(98.21%)和准确率(99.62%),而总的训练时间要短得多。结果表明,该方法具有较高的正确率(98.21%)和较高的正确率(99.62%)。
这项研究突出了人工智能的好处和坏处。虽然人工智能可以用来损害声誉和传播错误信息,但它也可以用来防止信息传播,在新冠肺炎大流行这样的危机中,人们强烈感受到了信息传播的危害。
请阅读“电子成像杂志”的原文:库尔、库马尔和库马拉古鲁,“深度假象:使用卷积长期短期记忆检测脸部交换视频剪辑的时间序列分析”,DOI 10.1117/1.JEI.29.3.033013。