走向无监督学习的人工智能物理学家(2018年)

2020-11-15 04:27:57

下载PDF摘要:我们调查了改善无监督机器学习的机会和挑战,使用了四种在物理学上有悠久历史的常见策略:分而治之、奥卡姆剃刀、统一和终身学习。我们没有使用一个模型来学习一切,而是提出了一个新的范式,它以学习和操纵*理论*为中心,简略地预测未来的各个方面(根据过去的观察)和这些预测准确的领域。具体地说,我们提出了一个新的广义平均损失来鼓励每个理论专注于其相对有利的领域,并提出了一个可微描述长度的目标,以减轻不良数据的权重,并将所学的理论转化为简单的符号公式。理论存储在一个理论中心,它不断地将学习到的理论统一起来,并在遇到新环境时提出理论。我们在一套日益复杂的物理环境中测试我们的实现--玩具AI物理学家LearningAgent。通过对涉及重力、电磁、简谐运动和弹性反弹随机组合的世界的轨迹进行监督观察,我们的代理通常学习速度更快,产生的均方预测误差比相当复杂的标准前馈神经网络小约10亿倍,通常精确地恢复整数和有理理论参数。我们的代理还成功地识别了分段恒力场中的非线性混沌双摆具有不同运动规律的区域。