机器学习模型有助于对药物发现中的化合物进行表征

2020-10-14 23:21:56

串联质谱是一种强大的分析工具,用于表征药物开发和其他领域中的复杂混合物。现在,普渡大学的创新者创造了一种新的方法,将机器学习的概念应用到串联过程中,以改善新药开发中的信息流。他们的研究发表在“化学科学”上。

普渡大学科学学院的分析和物理化学助理教授Gaurav Chopra说,质谱在科学和发展中发挥着不可或缺的作用。这里给出的具有少量正负训练数据的自举机器学习的具体实现将为化学家自动表征化合物的日常活动的主流铺平道路。

乔普拉说,用于化学科学的机器学习领域存在两个主要问题。使用的方法不提供对算法做出的决策的化学理解,新方法通常不会用于进行盲目实验测试,以查看建议的模型是否适用于化学实验室。

乔普拉说,我们已经解决了这两个项目的方法学问题,这种方法学具有异构体选择性,在表征复杂混合物、识别和药物代谢物以及蛋白质组学和代谢组学等领域非常有用。

普渡大学的研究人员创建了统计上稳健的机器学习模型,以使用较少的训练数据-这项技术将对药物发现有用。该模型着眼于一种名为2-甲氧基丙烯(MOP)的常见中性试剂,并在串联质谱仪中预测化合物将如何与MOP相互作用,以获得化合物的结构信息。

分析化学和有机化学的Frank Brown杰出教授Hilkka Kenttämaa说,这是机器学习第一次与诊断气相离子-分子反应相结合,这是一个非常强大的组合,引领着有机化合物的完全自动化质谱鉴定。我们现在正在将许多新的试剂引入这种方法。

普渡团队介绍了化学反应流程图,以便于解释该方法做出的决定,这将有助于理解和解释结构信息的质谱。更多信息:Jonathan Fine等人,基于图形的机器学习解释和预测串联质谱中的诊断异构体选择性离子-分子反应,化学科学(2020)。DOI:10.1039/D0SC02530E