用机器学习驯服量子复杂性

2022-02-17 01:51:14

霍恩伯格和科恩的工作证明了一个强大的主方程——普适密度泛函的存在。该方程将以电子汤为例，计算其能量，引导物理学家找到最自然的电子排列（能量最低的电子）。从原理上讲，该函数可以描述任何系统，从硅砖到水分子，从这个意义上说，它是通用的。

唯一的问题是，没有人知道这个等式是什么样子。

不久，Kohn和另一位物理学家Lu Jeu Sham首次成功地写出了一个实用的密度泛函。一个精确的函数捕捉电子行为的所有细微方面应该是难以形容的复杂，所以他们把它一分为二。上半场是他们知道怎么做的部分。它提供了一组电子的能量，这些电子只能平均感知彼此。其他一切——拜占庭量子效应和非局域相互作用产生的多余能量——都进入了下半部分：一个被称为交换和关联泛函的模糊因子。

尼顿说，他们“把我们不了解的功能简化为一小部分。”。

在接下来的几十年里，科学家们以科恩和沙姆的工作为基础，用越来越聪明的方法来估算福吉因子，密度泛函成为了理解电子的事实上的方法。研究人员利用它们来预测原子捕获或释放电子的可能性、分子振动的方式（好奇号探测器用来寻找火星上生命迹象的信息）、晶格中原子的排列、材料中的声速等等。该理论源源不断的应用为科恩赢得了1998年的诺贝尔奖。

当研究人员要求DFT具有更高的精度时，他们不得不考虑到泛函的交换项和关联项中所包含的无知，从而使草图的细节更符合普适密度泛函。

人工智能公司DeepMind的理论化学家阿伦·科恩（Aron Cohen）是寻找神秘宇宙方程式的人之一。为了扎根于理论量子化学的抽象领域，他手边放着一个蓝色的3D打印桌面玩具。它看起来像一个塑料幸运饼，它的曲线勾勒出了一个具有普遍性的函数的确切形状，但只适用于最简单的系统：它可以用来揭示人们可能想知道的关于任意两个原子之间共享的两个电子的任何信息。不过，它提醒他，可能存在一种可以处理任意数量的电子和原子的泛函。“我们正在寻找的是这样的东西，”他说；只是要复杂得多。“这是真的。”

DFT研究的一个主要目标是找到更精确的泛泛函近似。坦普尔大学（Temple University）的物理学家、领先的函数开发人员约翰·珀德（John Perdew）长期以来一直是这项工作的带头人。他将通往通用功能的道路描述为爬梯子上的梯级。在每一个梯级上，物理学家都会给函数添加新的成分。最简单的配料就是每个位置的电子炖菜的厚度。在下一个阶段，功能还考虑了厚度在不同位置的变化速度，为研究人员提供了更广阔的视野，并使功能更精确。

Perdew策略的一个关键部分是使用物理推理来确定好的近似必须遵守的某些数学特性，即“精确约束”更高的梯级满足更多的约束条件，研究人员必须更努力地寻找符合这些约束条件的方程式。

Perdew的团队于1999年开始研究混合了六种成分的三级功能，2015年，他发布了一款名为SCAN的最新功能。这是他第八次尝试，也是第一次遵守与第三级相关的所有17个已知约束。扫描既适用于分子，也适用于固体，已证明是迄今为止发现的最有能力的普适泛函近似之一。

“第三级泛函有非常丰富的可能性，”珀德说。“弄清楚什么是重要的，什么是有效的需要时间。”

随着珀德用物理直觉改进密度泛函的艺术，一场革命正在酝酿之中。算法能否找出电子行为中过于微妙的模式，让人类无法用数学方法记录下来？

2012年，伯克和他的合作者首次尝试将机器学习应用于一组简化的电子。他的一维原型促使他和其他研究小组研究算法是否能让研究人员更上一层楼。

一个突破出现在2021年初，当Burke和合作者建立了一个神经网络的玩具问题，可以跟踪密度误差，以及能源错误的方式，大多数以前的尝试忽略。卢森堡大学的一位理论化学家Alexandre Tkatchenko说：“为了获得一种既能给你带来密度又能给你带来能量的功能，你需要一个非常灵活的体系结构。”“用你的头脑写一个函数形式并不容易。”

Stony Brook的费尔南德斯·塞拉（Fernández Serra）使用类似的策略设计了一个神经网络，该网络将研究一系列分子和能量，并搜索符合大多数已知约束条件的第三级函数，基本上是使用一台机器来追溯珀德的足迹。

在2021秋季的物理评论B中，她和Sebastian Dick在《物理评论B》中报道，由此产生的交换和相关功能性的节拍扫描可以将不熟悉的分子的能量预测大约10%。但这一适度的收益表明，珀德的工作已经接近找到第三个阶梯的上限。

费尔南德斯·塞拉说：“物理直觉不知何故耗尽了你所能达到的几乎所有东西。”。“Perdew的功能真的很好，不需要使用机器学习。”

爬得更高需要更复杂的输入——以及理解这些输入的算法。

在疫情爆发前不久，DeepMind的研究人员征服了棋盘游戏围棋，正在寻找新的挑战。他们对科学机器学习问题特别感兴趣，科恩把它们称为DFT。他花了数年时间研究简单系统的精确函数，比如他放在桌上的那个。但它们远没有复杂到足以描述现实世界。

他说：“想要找到对化学有用的东西，感觉是一条漫长的道路。”。

DFT的一个核心弱点尤其侵蚀了科恩。电流密度泛函通常会过多地抹去电子。对于不平衡的系统来说，这个问题尤其突出，因为电子应该主要聚集在一个分子上。DFT倾向于将电子汤更均匀地分布在两个分子上。一个相关的问题出现在化学反应中，当DFT为粒子合并和分离给出错误的能量时，即使是像氢原子这样简单的情况。科恩说：“这是一匹主力马，但我知道它有这些巨大的失败。”

为了设计他们的下一代功能，科恩和DeepMind团队选择不太担心满足一长串物理原理。相反，他们会依赖数据，大量数据。他们在文献中搜寻数千个具有已知能量的分子的数据库（使用薛定谔方程或类似方法进行了大量计算）。然后他们更进一步，使用超级计算机来计算数百个额外分子的能量——其中许多需要数天的时间来计算。

当该团队收集了一个详尽的示例分子库时，科恩和其他化学家决定了功能性分子的结构。

他们采用了一种诱人的多才多艺的方法。经过多年的反复试验，研究人员发现了一种估算部分交换和相关函数的特殊方法。当一个功能部件的80%能量以一种方式计算，另一种方式的20%能量计算时，性能有一个最佳点。长期以来，研究人员一直怀疑下一步将是让分子周围的80/20比例在点与点之间变化，但没有人完全成功地做到这一点。

伯克在1998年介绍了这种函数式，他说：“可能有100篇论文，人们在其中使用这种形式，但他们没有制作出每个人都可以使用的东西。”。“也许这对一个人来说太难了。”

凭借大量的示例分子和DeepMind团队的机器学习专业知识，该团队的神经网络能够训练出一种灵活的第四级功能。与扫描和其他顶级竞争对手相比，它能更好地估计大量分子的能量，这主要是因为它能更准确地放置电子，更好地描述它们的自旋。这一功能被称为DM21，是第一个能够处理化学键断裂和形成的通用功能。12月9日，该组织描述了它们在科学上的功能。

“这是第一个合理的通用功能，”伯克说，他没有参与。“如果这个东西像它看起来那么好，一年之内就会有成千上万的人开始使用它。”

然而，伯克提醒说，全面测试功能需要时间。该领域到处都是最初看起来很有希望但隐藏了致命缺陷的功能的残骸，研究人员才刚刚开始分离DM21。

DM21的一个缺点是，它对周期表前三行的分子进行训练，而周期表中的数据更丰富。这意味着它学到的电子行为可能不会传递到金属原子或固体材料上，例如，这两种材料对于分析铜基高温超导体家族至关重要。目前，代表这些系统的通用泛函的细节仍然可以通过扫描和其他泛函更好地近似。

“在可预见的未来，我认为不会有一个功能性的解决方案，”特卡特琴科说。

Fernández Serra和DeepMind等新泛函的发展表明，机器学习可以成为探索宇宙密度泛函新区域的强大工具，尤其是那些与分子和化学相对应的区域。

Tkatchenko说，这有助于“真正调整你想要解决的化学空间部分，并使其尽可能高效地发挥作用”。“我认为机器学习技术真的会留下来。”

但改进后的化学功能是否能揭示从原子到材料的一切相关的一般特征仍有待观察。例如，Perdew继续寻找新的直觉品质，以传统方式进一步完善泛函。“我可能不会花太多时间在机器学习上，”他说，“因为虽然机器可以学习，但它们还不能向我们解释它们所学的东西。”

科恩希望DM21已经瞥见了普遍的特征，这些特征可能成为未来近似值的持久元素，无论它们是由人类大脑还是神经网络生成的。

“功能是无限复杂的，所以对它进行任何攻击都是好的，”他说。“理想情况下，我们希望将它们统一起来。”

https://www.quantamagazine.org/quantum-complexity-tamed-by-machine-learning-20220207/