除非你是物理学家或工程师,否则你没有太多理由去了解偏微分方程。我知道呀。在大学学习机械工程的时候,我花了很多年的时间研究它们,从那以后,我再也没有在现实世界中使用过它们。
但是偏微分方程,或PDE,也是一种神奇的东西。它们是一类数学方程式,非常擅长描述时空的变化,因此在描述我们宇宙中的物理现象时非常方便。它们可以用来模拟一切,从行星轨道到板块构造,再到扰乱飞行的空气湍流,这反过来又允许我们做一些实际的事情,比如预测地震活动和设计安全的飞机。
问题是偏微分方程是出了名的难以解决。在这里,“解决”的含义或许最好用一个例子来说明。假设您正在尝试模拟空气湍流以测试新的飞机设计。有一种已知的偏微分方程叫做纳维斯托克斯(Navier-Stokes),用来描述任何流体的运动。“求解”Navier-Stokes允许您拍摄空气运动的快照(也称为。风条件),并模拟它将如何继续移动,或它以前是如何移动的。
这些计算是高度复杂和计算密集的,这就是为什么使用大量PDE的学科通常依赖超级计算机来进行计算。这也是为什么人工智能领域对这些方程特别感兴趣的原因。如果我们能够利用深度学习来加快解决这些问题的过程,这将对科学研究和工程有很大的好处。
现在,加州理工学院的研究人员引入了一种新的深度学习技术来解决偏微分方程,这种技术比以前开发的深度学习方法要精确得多。它也更具通用性,能够求解整个偏微分方程组-例如任何类型流体的Navier-Stokes方程-而不需要重新训练。最后,它比传统的数学公式快1000倍,这将减轻我们对超级计算机的依赖,并增加我们模拟更大问题的计算能力。没错。来吧,来吧。
在我们深入研究研究人员是如何做到这一点之前,让我们先来欣赏一下结果。在下面的gif中,您可以看到一个令人印象深刻的演示。第一列显示了流体运动的两个快照;第二列显示了流体在现实生活中如何继续运动;第三列显示了神经网络如何预测流体将会运动。它看起来基本上和第二个一模一样。
这份报纸在推特上引起了很多议论,甚至还有说唱歌手MC Hammer的喊叫。是的,真的。
这里要理解的第一件事是,神经网络基本上是函数逼近器。(说什么?)。当他们在一组成对的输入和输出的数据集上进行训练时,他们实际上是在计算函数或一系列数学运算,这些函数或一系列数学运算会将一个转换为另一个。考虑一下建造一个猫探测器。您通过向神经网络提供大量猫的图像和非猫的东西(输入)并分别为每组标记1或0(输出)来训练神经网络。然后,神经网络寻找最佳函数,该函数可以将猫的每幅图像转换为1,将其他所有图像转换为0。这就是它如何看着一张新的图像,并告诉你它是否是一只猫。它正在使用它找到的函数来计算它的答案-如果它的训练很好,它会在大多数情况下都是正确的。
方便地说,这个函数逼近过程就是我们求解偏微分方程所需要的。我们最终试图找到一个函数来最好地描述,比方说,空气粒子在物理空间和时间上的运动。
现在,这就是这篇论文的症结所在。神经网络通常被训练成近似欧几里得空间中定义的输入和输出之间的函数,欧几里得空间是具有x、y和z轴的经典图形。但这一次,研究人员决定在傅立叶空间中定义输入和输出,这是一种用于绘制波形频率的特殊类型的图表。加州理工学院(Caltech)教授阿尼玛·阿南德库马尔(Anima Anandkumar)与同事安德鲁·斯图尔特(Andrew Stuart)和考希克·巴塔查里亚(Kaushik Bhattacharya)共同负责这项研究,她说,他们从其他领域的工作中得出的直觉是,类似空气运动的东西实际上可以描述为波频率的组合。宏观层面上的风向就像低频,有很长的昏昏欲睡的波浪,而微观层面上形成的小涡流就像高频,但频率很短很快。
这有什么关系呢?因为在傅立叶空间中近似傅立叶函数要比在欧氏空间中与偏微分方程争论容易得多,这大大简化了神经网络的工作。提示主要的精度和效率收益:除了与传统方法相比具有巨大的速度优势外,他们的技术在求解Navier-Stokes时的错误率比以前的深度学习方法低30%。
整个过程非常巧妙,也使该方法更具通用性。研究人员的实验证实,以前的深度学习方法必须针对每种流体单独训练,而这种方法只需训练一次就可以处理所有的流体。虽然他们还没有尝试将它扩展到其他例子,但在求解与地震活动相关的偏微分方程时,它应该也能够处理每一种地球成分,或者在求解与热导率相关的偏微分方程时,它应该能够处理每种材料类型。
教授和他们的博士生做这项研究并不只是为了理论上的乐趣。他们希望将人工智能带入更多的科学学科。正是通过与气候科学、地震学和材料科学的不同合作者交谈,阿南德库玛第一次决定与她的同事和学生一起应对PDE挑战。他们现在正在与加州理工学院和劳伦斯·伯克利国家实验室的其他研究人员合作,将他们的方法付诸实践。
阿南德库马尔特别兴奋的一个研究主题是:气候变化。Navier-Stokes不仅擅长模拟空气湍流,还用于模拟天气模式。“在全球范围内进行精确的天气预报是一个极具挑战性的问题,”她说,“即使是在最大的超级计算机上,我们今天也不能在全球范围内做到这一点。”因此,如果我们能使用这些方法来加快整个管道的速度,那将产生巨大的影响。“。
她补充说,还有很多更多的申请。“从这个意义上说,天空是无穷无尽的,因为我们有一个通用的方法来加快所有这些应用程序的速度。”