在科学中,粒子物理学具有奢侈的理论基础。通常,我们专注于基本粒子,并用标准模型等量子域理论使用量子理论模拟它们。为了与数据进行比较,我们还必须模拟额外的辐射,衰减,结龙,以及粒子与探测器的相互作用。我们描述了与Pythia或Geant4这样的复杂计算机模拟的这些效果。
模拟允许我们模仿我们在实验中可能观察到的理论参数的任何值,这通常对应于粒子的质量和耦合或有效场理论的威尔逊系数。 Feynman着名的“我无法创造的东西,我不明白”......但能够创建合成数据意味着了解吗?并不真地。
最终,我们的目标不是将模型和参数值转换为合成数据,计算机模拟优异。相反,我们的目标是从观察到的数据中提取物理学和理论参数的值。在某种意义上,科学方法的推理步骤沿着粒子物理模拟器的前向操作模式的逆方向进行。
作为罗伯特·兄弟最近在本通讯中解释的,所谓的推理(假设测试,置信区间和参数测量)是似然函数:观察到的数据的概率密度,评估为理论参数的函数。似然函数允许我们找到理论参数(通过最大似然估计器)的最佳选择点,以及将误差栏放在它们上(来自似然比测试的置信区)。
现在这里是问题:当我们描述使用模拟器的过程和观察到的数据是高维的时,我们无法实际计算似然函数!我们可以象征性地编写似然函数,但评估它需要集成到导致相同观察数据的所有可能的事件历史。由于使用现实检测器模拟模拟事件,因此易于涉及数百万个随机变量(在单个事件的模拟中制作的不同随机选择),这是一个超过一万维空间的一体。因此,虽然我们可以使用Monte Carlo来解决这个分布,但仍然是不可能的,虽然是不可能的,但没有办法直接评估似然函数。
传统上,通过将粒子碰撞中的高维数据减少到单个运动变量,粒子物理学家通过减少收集的高维数据来解决了这个问题。例如,在寻找Higgs玻色子腐烂的迹象到四个leptons时,只能考虑重建的四勒斯顿系统的不变质量。在将高维数据减少到该单个运动量变量之后,可以通过用模拟和观察数据填充直方图来近似似然函数。在粒子物理术语中,这称为分析(单个)差分横截面。在统计信息中,这个运动变量 - 直方图的x轴上的内容 - 被称为摘要统计。
这种方法在粒子物理学中如此建立,它通常被视为理所当然。这是可以理解的,因为将数据的减少到摘要统计数据首先使推理成为可能。它也非常成功(我们毕竟发现了Higgs玻色子并以这种方式确定了其联轴器和质量)。
Warning: Can only detect less than 5000 characters
基于机器学习的推断方法的示意性工作流程。在第一阶段,我们模拟事件,存储事件数据以及可以从Monte-Carlo真实记录计算的矩阵元素权重。其次,我们使用模拟事件和矩阵元素权重来训练神经网络以了解似然比功能。第三,神经网络用于推断,例如以确定最佳拟合点(最大似然估计器)和限制(信心集)。从“利用机器学习的有效田间理论”。
这些新的基于机器学习的方法与所谓的矩阵元素方法具有多大的共同点,该方法还旨在为数据提供未键入的,多变量似然函数。然而,矩阵元素方法需要总结淋浴和具有传递函数的检测器效果,而基于机器的基于机器的推断方法则不需要简化底层物理和支持最先进的淋浴和探测器模拟。基于机器的基于机器的方法也是“摊销”:在发电训练数据的前期计算成本之后,培训神经网络,可以在微秒内进行新事件的可能性。但最重要的是,他们允许我们从观察到的数据中获取更多信息。在若干早期现象学研究中,这些方法导致了更精确的测量和搜索更好的限制。例如,以下绘图显示了在LHC中与W玻色子一起生产的两个EFT参数的预期限制:
预期对两个EFT参数C HW和C(3)HQ精度测量的限制。红色虚线和绿色划线线显示了基于两个运动变量的传统分析的预期限制。纯蓝线显示了从这里讨论的基于机器学习的分析的预期限制。它围绕标准模型点(本图中的原点)基本上更紧密,表明这里呈现的方法可以导致更灵敏的测量。来自"在WH生产中的简体模板横截面;
对这些方法感兴趣的人不必通过所有数学本身工作或从头开始实施算法。 Python Library Madminer实现了它们,并将其直接应用于大多数粒子物理测量。 Madminer围绕Madgraph 5,Pythia 8和Delphes,为典型的现象学研究提供了成分。甚至还有在线教程。应该注意的是,这种方法也与像Geant4这样的完整检测器模拟也兼容:必要的信息可以通过类似于用于评估PATON分布函数中的不确定性的权重的检测器模拟来传递。尽管如此,这仍然需要在实验模拟软件中进行一些投资。
我们在本章中描述并讨论了这些方法及其软件实现,即将到即将到来的“粒子物理学AI”的书籍。
目前介绍的分析方法已迄今为止已应用于V VOSES融合中的HIGGS精密测量的现象学研究,WH生产和TTH生产中,以及ZW测量以及搜索巨大共振衰减到DIJET中。基于新的机器学习技术一直导致比传统的基于直方图的方法更敏感的分析。使用矩阵元素信息有效地允许我们减少我们所需要的模拟数量。在机器学习中的持续进展以及软件包的发展使应用这些方法更容易,将这些基于仿真的推理技术的应用应用于LHC实验中收集的数据似乎是迫在眉睫的。
粒子物理远离唯一使用复杂模拟器来对数据进行预测的唯一领域,因此面临建模可能性功能的挑战。同样的问题出现在神经科学的生态学中,从系统生物学到流行病学,从气候科学到宇宙学,等等。基于模拟的术语推断(我们的优选术语)或无似然推点用于指用于解决这些问题的一般技术。这个问题的这种常见框架是一个Lingua Franca,为来自不同域名,统计学家和计算机科学家的科学家提供了一个机会,将分析方法一起开发并彼此学习。
基于仿真的推断是跨学科研究的主动和令人兴奋的区域和粒子物理正在促进影响其他领域的想法的区域。进展主要沿三种广泛趋势发生。我们已经提到了机器学习的革命,这让我们有效地解决了更高的数据。第二个趋势是模拟和推断的更紧密集成,粒子物理学中的矩阵元素信息的有效使用是其中的一个示例。最后,主动学习描述了使用过去知识和观察数据来模拟更多数据在参数空间区域中的更多数据,其中预期最有用,更高提高样本效率。
在最近由国家科学院诉讼程序发表的一篇文章中,我们广泛地讨论了基于模拟的推断,审查了沿着这三个趋势的最近进展,并提供了对这一令人兴奋的研究区的未来的自由观。