首先在机器学习中确认新行星

2020-08-27 05:51:03

由华威大学的科学家开发的一种新的机器学习算法已经证实了50个潜在的行星。天文学家第一次使用了一种基于人工智能的过程来分析潜在行星的样本,并确定哪些是真的,哪些是假的,或者是假阳性,计算每个候选行星成为真行星的可能性。这是第一次,天文学家们使用了一种基于人工智能的过程来分析潜在行星的样本,并确定哪些是真的,哪些是假的,或者是假阳性的,从而计算出每个候选行星成为真行星的可能性。

他们的结果发表在皇家天文学会月刊上的一项新研究中,他们还对这种行星验证技术进行了首次大规模比较。他们的结论为在统计上确认未来的系外行星发现时使用多种验证技术提供了理由,包括他们的技术。

许多系外行星调查从望远镜传来的海量数据中搜索行星在望远镜和恒星之间经过的迹象,这就是所谓的凌日。这会导致望远镜探测到的恒星发出的光线出现明显的下降,但也可能是由于双星系统、背景中物体的干扰,甚至相机中的轻微误差造成的。这些假阳性可以在行星验证过程中筛选出来。

来自华威大学物理系和计算机科学系以及艾伦·图灵研究所的研究人员建立了一个基于机器学习的系统,可以从美国国家航空航天局(NASA)的开普勒(Kepler)和苔丝(Tess)等望远镜任务发现的数千个候选行星的大样本中区分出真行星和假行星。

它接受了使用两个大样本确认的行星和现已退役的开普勒任务的训练,以识别真正的行星。然后,研究人员将该算法用于开普勒尚未确认的候选行星的数据集,产生了50个新的确认行星,并首次通过机器学习进行验证。以前的机器学习技术已经对候选者进行了排名,但从来没有自己确定候选者是真正行星的概率,这是行星验证的一个必要步骤。

这50颗行星的大小从海王星大到地球小,轨道长达200天,小至一天。通过确认这50颗行星是真实的,天文学家现在可以优先考虑这些行星,以便用专用望远镜进行进一步的观测。

来自华威大学物理系的大卫·阿姆斯特朗博士说:我们开发的算法让我们可以让50个候选者跨过行星验证的门槛,将它们升级为真正的行星。我们希望将这项技术应用于像苔丝和柏拉图这样来自当前和未来任务的大样本候选人。在行星验证方面,以前还没有人使用过机器学习技术。机器学习已经被用来对候选行星进行排名,但从来没有在概率框架中使用过,这是你真正验证行星所需的。与其说哪些候选者更有可能是行星,我们现在可以说精确的统计可能性是多少。如果候选者有不到1%的机会是假阳性,它就被认为是一个被验证的行星。";

华威大学计算机科学系的西奥·达穆拉斯博士、艾伦·图灵研究所数据中心工程和图灵研究员副主任西奥·达穆拉斯博士说:统计机器学习的概率方法特别适合于天体物理学中这样令人兴奋的问题,它需要纳入像阿姆斯特朗博士这样的专家的先验知识,并对预测中的不确定性进行量化。当概率方法的额外计算复杂性得到显著回报时,这是一个很好的例子。";

一旦建立和训练,该算法比现有技术更快,并且可以完全自动化,使其成为分析目前在TESS等调查中观察到的潜在数千个行星候选者的理想选择。研究人员认为,它应该是未来集体用于验证行星的工具之一。

阿姆斯特朗博士补充说:到目前为止,几乎30%的已知行星只用一种方法进行了验证,这并不理想。仅出于这个原因,开发新的验证方法是可取的。但机器学习也能让我们非常快地完成这项工作,并以更快的速度确定候选人的优先顺序。我们仍然需要花费时间来训练算法,但一旦完成,将其应用于未来的候选人就变得容易得多。您还可以合并新的发现来逐步改进它。像苔丝这样的调查预计会有数以万计的候选行星,能够一致地分析它们是理想的。像这样快速、自动化的系统可以用更少的步骤把我们带到验证的地方,让我们高效地做到这一点。更多信息:大卫·J·阿姆斯特朗(David J Armstrong)等人。用机器学习验证系外行星:50颗新验证的开普勒行星,皇家天文学会月刊(2020)。Doi:10.1093/mnras/staa2498