人工智能可以创作音乐、剧本和诗歌。看电影怎么样?

2020-08-22 02:47:30

人工智能需要多久才能按需制作一部真正的故事片?

为了便于讨论,让我们假设你长时间呆在家里看太多我们委婉地称之为“流媒体内容”的东西,我说的“流媒体内容”指的是电影和电视。想出你自己的理由--任何理由,从日本病态内向的隐秘小森,到躲避某种潜在的致命呼吸道病毒。在任何情况下,你都会在某个时候对所有可用的编程选项感到厌烦,在所有熟悉的标题选择菜单中闷闷不乐地滚动,直到你放弃为止。在这一点上,虎王更像是一个笑点,而不是一个电视节目,当然,你可以在标准频道深入挖掘历史上最具创造力的导演的深度,但这听起来很难,如果你像我一样,你会考虑阅读早间新闻,这是一种情绪化的劳动。

但是,如果有一个没有负面影响的电影流媒体服务呢?叫它“黑匣子”吧。你每次都会得到你想要的心情,但不像重看以前最喜欢的电影,它不会是翻新的,因为黑匣子上的两部电影永远不会是一样的。在“黑匣子”中,您可以从流派、情节、人物类型、位置和内容关键字等选项菜单中选择要包含或排除的关键字,而不是选择标题。

想要一部以你的年龄、种族、性取向、性别和宗教信仰为主角成为奥运游泳运动员的电影吗?没问题。想看这样一部电影吗?在电影中,一个和你老板在人口统计上相同的人被挤压致死,然后被一条缅甸蟒蛇吞噬。你的愿望就是它的命令。想不想省去细节,让命运来决定今晚会有哪部从未想象过的电影会给你带来娱乐呢?黑匣子已经掩护你了。

在您做出选择之后-当然还需要象征性地为必要的计算繁重任务支付象征性费用-您的订单将在Black Box HQ收到,原创电影将很快上路。

Black Box将您的规范转换为数据-或者,如果您没有要求任何特定内容,一个随机生成的数字噪声斑点就可以了-然后创建过程就可以开始了。第一个由1和0组成的集合将成为提示符,并被输入到一种名为转换器的人工智能中,它会通过一个有点像智能手机上自动完成功能的过程,为你的电影吐出文本剧本。

然后,这些剧本将被输入到今天矢量量化变分自动编码器的变体中-产生音乐的神经网络,基本上-产生零碎的声音,当串在一起时,形成定制电影中口语对话和音效的音频版本,外加管弦乐配乐。最后,在这个过程中最具挑战性的部分,这90分钟的音频和剧本一起进入了世界上最复杂的GAN或生成性对抗性网络。在一个场景接一个场景的工作中,黑匣子GAN将产生一个由真人角色组成的演员阵容-逼真的人类,或者至少是人类般的化身-从头开始制作,以及所有的场景,怪物,追车,狗,猫,以及让它感觉像一部真正的电影的小惊喜。

暂且撇开这种完全不可信的情景不谈,如果有人设法用当今的技术完成所有这一切,结果将会发生深刻的调整,可能会令人不安。不管“黑匣子”如何努力去制作一部正常的电影,人工智能的作者几乎保证了它的奇特之处。就目前而言。

曾经有一个相当老套的笑话,说所谓的创造性机器人的输出是衍生的和乏味的;这个笑话至少可以追溯到几十年前。

但是繁殖型的人工智能系统现在确实存在,而且它们已经暴露出自己有着严重扭曲的创造本能。2015年,名为“深梦”(DeepDream)的人工智能噩梦在网上发布,它是最早流行的生成性人工智能范例之一。谷歌工程师亚历山大·莫德文采夫(Alexander Mordvintsev)创建了一个系统,用于生成与图像识别系统对视觉世界的算法理解相匹配的输出。当它像病毒一样传播开来时,公众第一次尝到了真正的计算机“梦”的地狱味道--由于某种原因,噩梦般的景象被蠕虫般的漩涡、眼睛和一吨狗主导。从那时起,人工智能就大量推出了一些精神错乱的文化产品,比如意外的恐怖故事和弗兰克·西纳特拉(Frank Sinatra)关于在热水浴缸里度过圣诞节的离奇歌曲。

那么,鉴于到目前为止人工智能表现出的创作能力,我们真的应该指望有人来承担强迫人工智能制作整部电影的恶魔般的任务吗?

是的,根据杜克大学人工智能科学家大卫·卡尔森博士的说法。他告诉OneZero:“我认为最终会有人尝试这样做。”如果他们这样做了,卡尔森本人可能也会参与其中,他帮助设计了人工智能系统,将文本转化为2018年和2019年发表的论文的视觉叙事媒体。但是,卡尔森说,“那还有很长的路要走。你知道,至少要几年。“。

需要很多像卡尔森这样的头脑才能让人工智能系统喷出一部电影,因为这项任务不会像“让机器人看每部电影”和看出来的东西那么简单。无论你读过多少喜剧演员的推文,我们实际上距离它所暗示的技术里程碑-即通用人工智能,或者非常接近它的东西-还有几十年或几个世纪的时间。

一部人工智能制作的电影可能需要一步一步地精心设计,而不是把一个订阅了Netflix的Roomba扔在沙发上一万个小时,然后友好地要求它制作一部轰动一时的电影。这与单一的GAN截然不同,GAN接受过如此多的电影数据训练,以至于只需按一下按钮就可以吐出整个电影。宇宙中可能没有足够的硅来创造一个能够做到这一点的系统。

事实上,在尖端人工智能现在能做的事情和基于当代科幻小说和欺骗性标题的似乎可行的事情之间,存在着相当令人望而生畏的差距。就在我写这篇文章的时候,“每日邮报”关于人工智能的最新标题是这样写的:“中国国家通讯社在‘克隆’了一名人类记者之后,揭开了‘世界上第一个3D人工智能主播’的面纱。”正如你可能预料的那样,真实的故事并不像它听起来那么令人兴奋-它和“玩具总动员”中的安迪一样令人信服。与此同时,处于技术前沿的实际创生型人工智能系统仍然很难识别实验室条件之外的基本物体,如消防车和鸟类。

如果我们想要使用我们现在拥有的东西来创建一部100%的人工智能电影-这意味着除了最初的提示之外没有人工输入-Carlson提出了一个“逐步过程”,也就是在本文开始时基本上就是黑匣子系统的一般框架。卡尔森说:“我认为,考虑到目前的技术,我们很可能真的可以从剧本变成在某种程度上令人信服的录音。”但是视频比音频难多少呢?在他自己的研究中,卡尔森说,“视频的困难在于场景的变化和一致性。”

一致性是卡尔森研究的关键词之一。对于我们来说,这意味着电脑很难实现我们影迷所说的“连续性”。退出框架的对象可能与重新进入框架的对象无关,或者它们可能完全从现实中消失。

卡尔森说:“除非你特别指出场景之间必须有逻辑上的一致性,否则很有可能你的第一个场景里有一组人,然后你只是切换角度,然后就是一组完全不同的人在谈论同样的事情。”诀窍是“表示数学中的内部一致性”。

或者,也许不一致和其他类似的问题才是全部的意义所在。与奥斯卡·夏普(Oscar Sharp)交谈时,人们会感觉到,他更感兴趣的是人工智能必须向他展示的东西,而不是他能命令人工智能制作的东西。这是一部2016年的病毒式短片,由一名人工智能编剧,然后通常由硅谷的托马斯·米德尔迪奇(Thomas Middleditch)主演。夏普告诉OneZero,问这个问题“有人不会做什么?”是“通向很有创意的东西的一条很好的捷径。”这样,他解释说,“你去了一个我们没有探索过的地方。”

的确,“阳光之春”展示了一些令人难忘的时刻,除了大卫·林奇或亚历杭德罗·乔多洛夫斯基之外,很难想象有任何有机的人类会想到这一点。这也是一种用真正令人费解的对话折磨演员的练习。

夏普不是计算机科学家,因为他依赖于纽约大学人工智能研究员罗斯·古德温(Ross Goodwin)。他解释说:“我对这些系统的工作原理只略知一二。”“我更喜欢蒙住自己的眼睛--大多数时候--不知道正在使用的确切过程。”尽管如此,他还是和他的船员中的足够多的人工智能成员一起工作,知道他们的极限。他直截了当地说,他想制作世界上第一部全人工智能电影,但他和卡尔森一样,认为没有人可能通过创建一个针对每部电影的单一系统来实现这一目标,这种系统只需按一下按钮就能生成完整的电影。他说:“处理过程会有点多。”

阳光之春之后,夏普试图让人工智能艺术家在一个项目上尽可能多地进行创造性工作,而不仅仅是写剧本,结果是制作了一部名为Zone Out的短片。这部电影是按照循序渐进的过程创作的,与卡尔森概述的过程没有太大不同-加上比夏普最初打算的更多的人为干预。这不是单个GAN的工作,而是多个人工智能系统处理不同的工作。卷积神经网络旨在梳理公共领域的电影,并定位与人工智能生成的剧本中的地点和对象相匹配的视觉效果。然后,另一个人工智能系统被认为是选派“演员”-那些老电影中与剧本中的人相似的人,并“表演木偶戏”以配合剧本的对白。然后,另一位人工智能将为角色合成合适的声音,还有一位人工智能将创作音乐。夏普说:“它在大多数战线上都下跌了。”

一致性当然不是Zone Out的强项之一--角色的面孔不断变化,这只是一个问题。但你可以自己判断:

ZONE OUT的拼凑起来的感觉并不是一个错误。我们今天所知的人工智能倾向于狼吞虎咽地吞噬信息,然后吐出一些从这些信息中衍生出来的不同的东西-这似乎是夏普关于他的人工智能项目最吸引人的地方。夏普感兴趣的是他在人工智能系统中看到的训练数据与其他人想法的碎片之间的相似之处,这些片段存在于有创造力的人的脑海中。如果你问他这些相似之处与人工智能创作的艺术有什么关系,他会马上变得有哲理。“机器学习是人类思维的一个非常有用的比喻,”他说。如果你是一个有创造力的人,那并不意味着你就是真正的原创者。“我们在你们体内植入了大量人类制造的东西,现在你们又在制造东西。”

这就是夏普与梦想进行比较的地方。“当你闭上眼睛,模型仍然在那里,它仍然在预测,”他说。“这就是梦想。这也是我一直在导演的剧本。“。

然而,Adobe Research的首席科学家、经常评论计算机能否创造艺术的亚伦·赫兹曼(Aaron Hertzmann)博士却急于打破整个“计算机能做梦”的泡沫。他告诉OneZero:“人类做梦和从生成模型中随机抽样之间的类比是不完美的,因为生成模型没有意识或潜意识。”有时,随机抽样有一种梦幻般的品质;这是一种文体描述,而不是认知描述。“。

赫兹曼告诉我,一部人工智能制作的故事片-如果能拍成-既不是艺术,也不是有价值的流行文化。他说:“没有理由相信目前存在任何一种技术,可以在没有人类作者指导的情况下创造出一种文化产品。”“即使纯粹是猜测,也无法想象这会是什么样子;这就像在1850年询问儒勒·凡尔纳(Jules Verne)2020年的图书会是什么样子。把它当作科幻小说来讨论是可以的,但你必须做出一些与我们目前所知不符的假设。“。

甚至卡尔森也承认,达到“人工智能制作的电影”里程碑的可能性取决于球门柱在哪里。

“也许我过于乐观了,”他说。“这取决于你认为什么是成功。”他说,如果有人想看第一部机器人电影,可能会缩短等待时间,满足于动画,或者是一部简短的而不是故事片,或者一部沿途有大量人类投入的故事片。

“你需要它在所有东西上都是照片真实感的吗,要有很强的一致性,等等?”他说。“今年我们不会有这样的情况。”