物理学中的人工智能:我们面临的是一场科学革命吗?

2020-07-21 21:40:17

人工智能重建了牛顿第二定律,发现了一个以前未知的暗物质质量计算公式。人工智能能让科学自动化吗?

科学的核心是两个基本组成部分:观察和逻辑。前者产生数据,然后我们可以从这些数据中使用逻辑来识别规律性,并用数学语言来表示它们。一旦公式化,数学公式不仅仅是对数据的描述-它使我们能够做出预测并发现以前未知的关系。为什么数学如此适合于制定自然法则,目前尚不清楚。理论物理学家和数学家尤金·威格纳(Eugene Wigner)在他的论文“自然科学中数学的不合理有效性”中写道,这是一份我们既不理解也不应得的奇妙礼物。没有数据和数学的互动,我们的文明就不会出现。但数据越广泛,关系就越复杂,找到正确描述数据中规律的数学公式通常需要更长的时间。如果你想在数学课上从二维坐标系中的数据中读取线性函数,你可以在5分钟内完成-或者在YouTube上快速观看一段视频。对于更复杂的任务,情况就不同了:例如,物理学家近百年来一直试图将量子理论和相对论结合起来。物理学家李·斯莫林(Lee Smolin)说,如果这项研究成功,可能需要几代人的时间来澄清这些影响。如果AI就像哥伦布,算力就是圣玛丽亚,人工智能能加速发现数学描述吗?如果用计算能力使科学自动化是可能的,那么科学进步就会受到摩尔定律的约束,并会有很大的增长。人工智能模型已经可以用来对复杂的数据关系进行建模和预测。其核心过程很简单:收集数据,训练人工智能,并做出预测。这既适用于人脸检测器,也适用于可以高精度预测三个物体在空间中运动的人工智能。人工智能学习和发现关系。但黑匣子神经网络几乎不可能理解网络内部的情况。即使洞察力是可能的,在深层神经网络中学习到的关系的表示也远不是所寻求的数学描述。符号回归产生了数学描述,符号回归方法可以改变这一点。它可用于从网络中内部表示的关系导出数学公式。

符号回归作为一种遗传算法进行。该算法配备了变量和数学运算符,搜索最简单的数学公式,利用该公式可以再现已知数据。为此,它生成大量公式,将它们的预测与已知数据进行比较,并且只采用与实际数据近似的公式。然后,对幸存的公式进行修改,并再次相互比较。在该过程结束时,通常会大致正确地再现现有数据和一个简单的数学公式。从力学的基本方程出发,研究人员现在已经用这种方法来描述粒子的运动和暗物质的质量分布。为此,他们使用所谓的神经图网络(GNN)。这些神经网络依赖于图形,而不是一个接一个排列的层。图形由几个相互连接的顶点(边)组成。节点包含通过连接传递给相邻节点的信息,并因此改变接收点的状态。通过这种方式,每个节点逐渐接收关于整个图的信息。神经图网络特别适合映射物理系统,因为这些系统通常由单个单元(如粒子)之间的交互组成。例如,如果要预测几个粒子的运动,则节点存储有关单个粒子的信息,例如坐标、最后移动方向和质量。

一对节点对应于两个相互作用的粒子。这些连接包含有关来自相邻粒子(节点)的各个粒子(节点)上作用力的信息。整个系统可以推导出单个粒子的加速度。如果用相应粒子运动的数据集来训练GNN,则它对粒子相互作用的映射会变得越来越好。由博士生迈尔斯·克兰默(Miles Cranmer)领导的研究人员现在已经训练了一个GNN,并使用符号回归从网络中推导出力学的基本方程-力是质量乘以加速度。他们的结果清楚地表明,数据、神经图网络和符号回归的混合实际上适合于提取数学公式-在这种情况下,