如何诊断和治疗新冠肺炎困扰的机器学习模型

2020-08-19 02:54:43

阿努帕姆·达塔(Anupam Datta)是Truera的联合创始人、总裁兼首席科学家,也是卡内基梅隆大学(Carnegie Mellon University)的教授。

贾斯汀律师是Truera的首席产品官,曾担任谷歌云AI平台的产品负责人。

公司需要采取措施深入检查ML模型,并获得有效更新模型和周围业务规则所需的洞察力。

新冠肺炎对经济的破坏是前所未有的,它的迅速扰乱了供应链,暂时关闭了零售店,改变了在线客户行为。它还在一夜之间大幅增加了失业率,增加了个人和企业的财务压力和系统性风险。据预测,全球GDP可能受到高达0.9%的影响,与2008年金融危机不相上下。虽然我们的复苏性质尚不得而知,但如果2008年的危机可以作为一个指标,那么通过消费者和企业行为和态度的短期调整和长期转变,新冠肺炎的影响可能会持续多年。

这种干扰会影响机器学习模型,因为模型在训练时学到的概念和关系可能不再适用。这种现象被称为“概念漂移”。面对概念漂移,ML模型可能会变得不稳定,表现不佳。这正是现在新冠肺炎身上正在发生的事情。这些漂移的影响将在相当长的一段时间内感受到,模型将需要调整以跟上。好消息是,模型智能技术已经有了重大发展,通过明智的使用,模型可以灵活地适应这些漂移。

随着新冠肺炎(以及经济关闭和重新开放)效应的发挥,对社会经济行为的影响将有明显的阶段性。业务规则和模型的更新需要与每个阶段的整体行为转变同步进行。公司需要采取测量-理解-行动的方法,并在生产或开发以及周围的业务规则中不断检查、评估和调整ML模型。

检查ML模型是如何受到影响的意味着要进行一次练习,以测量和了解模型在冠状病毒之前的行为方式、它们现在的行为方式、它们表现不同的原因(即,哪些输入和关系是改变的驱动因素),然后确定新的行为是预期的、准确的,还是不再有效。一旦确定了这一点,下一步自然就是行动起来:“那么,我们能做些什么呢?”