$ 1T美元ML模型(成绩单)

2021-01-17 01:57:27

欢迎观看实用AI的另一集。这是丹尼尔·怀特纳克(Daniel Whitenack)。我是SIL International的数据科学家,我的共同主持人克里斯·本森(Chris Benson)一如既往地加入其中,他是洛克希德·马丁公司(Lockheed Martin)的首席新兴技术策略师。克里斯,你好吗?

我过得很好记录下来,我们正处于正常的12月下旬假期高峰期。一切都很好。

是的,想要使您承诺的所有那些年底项目都能够在2020年底之前完成吗?

我已经失败了,因为直到今天,我已经在放假了。这是我的第一天。

那已经完成了。我什么都没做到2021年,所以明年我可以找借口。

是的并不是说今年会有任何原因–您知道,今年没有发生任何会导致项目中断的事情,或者…

我不知道大家都说,整个大流行病-相当疯狂的一年。我对疫苗问世感到乐观,认为2021年对所有人来说都是更好的一年。

是的好吧,我很期待在家里过圣诞节,有一群人,有一些美味的食物,但也有短暂的休息和愉快的放松时光。

是的,重设,然后跳回年份。我希望我们所有的听众也能度过一个美好的假期。如果您在休息期间碰巧正在从事有趣的附带项目,请在我们的Slack频道,LinkedIn或Twitter或其他地方告诉我们。我们很想听听这些。

克里斯,我真的很兴奋。据我所知,我们在Slack渠道中曾多次要求我们进行的一项工作是,从具有该专业知识的人员那里更深入地研究AI的金融应用程序。这个星期肯定有一个人和我们在一起。本周我们有Madhurima Khandelwal,他是美国运通AI实验室副总裁兼负责人。欢迎,Mads。你好吗?

做的很好。到这里来真是太好了;感谢您抽出宝贵的时间。在我们深入探讨AI和金融的所有事物之前,您能否简单介绍一下您的背景以及您如何对AI感兴趣并最终做您现在正在做的事情?

当然。我个人是在印度新德里出生和长大的,并且在美国运通(American Express)工作了15年以上。在此任期内,我担任过各种职务,职责越来越重……我目前是AmEx AI Labs的副总裁兼负责人。在此职位上,我领导了构建最先进的AI产品和功能的章程,这些产品和功能可解决整个公司需求中的高影响力,复杂的业务问题。

我的团队来自班加罗尔和纽约,如果我回想一下,在这个任期内,我总是担任过自己在未曾涉足的领域的角色……但与此同时,我在每个领域都感到支持我的职业生涯中也要努力寻找这些机会。这就是关于我自己的一点点。

太棒了这太酷了。我想知道–所以您提到了美国运通AI实验室…我知道在一个特别大的组织中,有一个创新实验室甚至为AI应用程序建立一个特定的实验室是相当普遍的,因为这可能是一种较新的事物该组织的其余部分没有很多经验,或者需要特殊的原型制作……这是美国运通(American Express)的一种模式,还是Labs是什么意思?它更像是一项研究工作,还是如何工作?

我认为恰恰相反,美国运通(American Express)多年来一直在AI / ML领域进行投资……而实验室到今天的形成方式-它在研究方面可以发挥作用,但是在我们向建模社区提供工具和平台的地方,它也可以发挥作用,以便他们能够以能够推动业务影响的方式利用AI / ML。

[]我们的业务部门中还有多个AI / ML团队,它们在各自领域内确实很出色。但是实验室的确可以解决那些可能存在的,横向的,整个公司范围的需求,并且可能需要进入一个专门的领域,这些特定的团队可能没有专门知识。但是我不会说AI / ML是存在的实际上仅在本实验室内;它在整个公司领域中几乎都是集成的-无论是风险,营销还是服务。

我一直很好奇,我想问一些人-当您开始负责美国运通的这一职能时,如果您看起来不是整个职业,而是最后几个职位,您是否喜欢自然人,或者您说过“这真是一件很酷的事情。我想领导,​​我要志愿服务?”?您是如何进入的?我喜欢听到有关人们如何进入这个领域的故事,因为他们总是与众不同。那么,就短期而言,您的情况如何?

因此,我知道您是在短期内要求我,但我会带您回到2005年,当时我加入了…

…因为那时我的角色几乎是营销和客户获取。我们正在构建传统模型来解决该问题。但是随着我角色的成熟,我们进入了数字营销领域,这确实导致了大量的提议进入生态系统,而我们能够解决该问题并且与客户相关的唯一方法实际上是冒险进入机器学习领域。这就是整个兴趣的产生所在,我们开始使用AI和ML,以便我们可以为客户个性化我们的数字资产。当您问我是否自然选择时,我认为这是一条两条路。这是我非常感兴趣的领域,而且值得庆幸的是,我的领导们也看到了我能够创建这些解决方案的能力,而且能够以能够扩大规模的方式来创建它……因此,我就是我所在的位置。

知道了听起来不错。您是可以做到的自然人,因为您是可以实现它的人。

是的,这种空间对我也总是很有趣-与正在进行的研究有着非常紧密的联系,无论是学术研究还是正在进入公司,还是实际上是在公司内部进行的研究……它如何在您的AI实验室中进行过实际的产品研究,以及研究可能永远无法产生成果的产品与专门确定要考虑产品的产品之间的平衡?

是的,我认为通常研究并不是从我们能够生产的思维开始的。我认为这是一项巨大的学习,甚至在一项研究上都失败了,因为即使那样您仍会学到一些东西。尽管通常会遇到一个您要解决的业务问题,但AI Labs是一支由博士和[难以理解]组成的团队,他们一直在挑战现状。当您挑战现状时,您几乎会去研究可能是业界最好的东西。我们可能无法立即利用的东西,但可能要三年才能使用。

[]在此过程中,我们正在学习到一些地方,我们可能无法生产出完整的解决方案,但是我们可能能够从中得出与我们今天甚至将来所要解决的问题有关的部分。我认为有很多成功的故事,但也有失败的故事,作为领导者,我也为这些失败感到自豪。这就是我们再次冒险进行这些研究时,使我们了解到需要做些不同的事情的原因。

您谈论的事情之一就是进行三年的评估...考虑到该领域的快速发展以及您的业务驱动力正在朝着您需要的方向发展,您如何评估呢?去你的生意吗?这是技术预测和业务预测的结合……鉴于在任何给定时间点显然没有足够的信息,您和您的团队如何做出这种判断?

我认为这既是对业务的了解,又是对技术的了解。我很高兴我们是一个团队,实际上两者完美结合。通常,我们能够解决问题并不是因为我们要问一个团队“您的AI / ML问题是什么?”,我们经常问的问题是“告诉我们您日常工作是什么?今天?”当有人向我们解释他们的过程是什么或产品是什么时,通常会产生关于我们如何使用AI / ML使其更好的想法。

让我为您举几个例子。在我职业生涯的早期,我们正在构建传统模型以及在数字资产空间(网站,移动应用程序,电子邮件)中进行个性化设置时所谈论的是眼前的问题是“我们的货架上摆满了很多产品。我们不知道当客户在频道上时该选哪个。”我们唯一可以解决的方法是构建一流的机器学习算法。

另一个例子-我刚才提到的这个例子是针对我们的外部客户的,但这里的另一个例子是针对我们的内部客户或同事的,我们也已开始将AI集成到运营功能中。这确实加快了我们的手动流程。如果您要问这些团队,他们会花费数小时自行执行这些流程,但是我们的产品现在可以为他们腾出时间,以便他们可以花时间进行更深入的分析和更复杂的任务。其中一个例子是我们如何为供应商管理团队创建一种工具,该工具几乎可以识别潜在的重复发票,否则他们会花费大量时间自己弄清楚。

因此,我认为这些是我们推动解决方案的领域,而不是因为我们问“您有什么AI / ML需求?”这个问题,而是因为我们了解了眼前的问题。

是的,当您谈论所有这些解决方案时,对我来说很有趣,有些解决方案可能不是人们在思考金融中的人工智能时首先想到的……所以也许有些人想到的是“哦,墙上的量子街道,正在优化交易”或类似的东西。也许其他人会想到欺诈检测或风险分析,这很常见,而且我敢肯定美国运通内部仍然非常相关-我们希望很快会谈论-但似乎还有其他应用程序美国运通是一个大型组织,这的确是事实。您正在处理很多文件,比如说……或者您还遇到了客户支持类型的问题或营销类型的事情,您必须处理……

[]当我稍微浏览一下AI Labs的网站时,它谈论的是自然语言处理,文档识别和处理-这两件事,例如NLP和这类计算机视觉,可能不是第一件事。当我在金融领域思考AI时,就会想到。您的团队有什么平衡?您是在内部进行大量的运营支持,还是侧重于会影响您实际金融产品的直接模型?那里有什么平衡,您如何看待?

因此,我不会说重点主要放在自动化部分或文档处理部分。我认为在公司中使用AI / ML的重点确实在信用风险,营销和服务范围内。这确实是在影响我们的外部客户。那就是我们一直关注的重点,而我们显然已经在此领域中不断前进,从而创造或改善了机器学习的整体用途。

是的,虽然我们已经掌握了该艺术,但是我们也已经开始在NLP,自动化和驱动价值方面进行投资。但正如您所说,丹尼尔(Daniel),我认为如果我们不谈论欺诈预防,这个故事就不为所知了,这一切都是从美国运通开始的。对于听众来说,预防欺诈确实是我们部署机器学习模型的最早领域之一。早在2010年,我们发现使用这些机器学习模型检测欺诈的能力得到了显着提高。

回到我们的信念,我们希望得到客户的支持,真正地为客户提供服务是我们的重中之重,而保持低欺诈率是实现此目标的关键。

疯了,我很喜欢您开始涉入这个防止欺诈的话题,因为我在教AI研讨会时就知道其中一件事,当我初次介绍机器学习或AI时可能会举很多例子,或在网上课程或类似的课程中,人们谈论欺诈检测,他们拥有一些数据集,其中可能包含一组指示交易的数字或一个人的历史记录,然后为1或0表示欺诈或非欺诈,对?我认为–我个人对此很好奇…我认为情况肯定比这复杂得多。有不同类型的欺诈,有与这些不同类型欺诈相关的不同数据……您能否仅向我们简要介绍一下或了解您主要关注的欺诈类型以及与该欺诈相关的数据?

[]是的,绝对。我认为,在欺诈方面,即使在在线欺诈领域,我们面临的第一大问题实际上是我们实时检测欺诈的能力。这意味着当实际进行交易时,我们可以决定该交易是否为欺诈行为。

如果您考虑美国运通(American Express)交易,我们每年的交易额超过1.2万亿美元,并且我们希望在交易发生时几毫秒内做出此决定。因此,真正构建可实时部署的机器学习模型的需求成为第一要务,因此我们能够为客户提供服务。

因此,虽然欺诈定义或数据保持为1/0,但它放大了全球范围内存在的交易数量,但与此同时,随着数字化的发展,您正在进行在线交易。您很难检测到欺诈行为,因为它通常不会在居民的实际住所发生……因此,我想说,各种各样的标识符会传入我们的模型中以进行检测。

但是更关键的是,我们真正能够实时运行此算法的能力,这是许多工程,许多体系结构在部署这些模型时发挥作用的地方。

你说的那个号码肯定吸引了我。一年大概有超过一万亿笔交易,或者类似的事情,我想如果我的粗略/快速计算出来的话,那就像是每分钟超过几百万,这对我来说是疯狂的。

是的,所以我可以肯定地说,我从来没有对我的任何模型进行过一分钟的两百万次推论……[笑]

让我问一个后续问题……这可能不是一个公平的问题,因为我不确定这是否很具体……但是我很好奇-是否存在某种特定类型的欺诈,例如欺诈,有一种通用类型的欺诈行为出现,或者您正在寻找不同类别的欺诈?我主要是在问这个问题。然后,当您解决这个问题时,我很好奇,您如何处理它?因为您正在谈论实时性,可能正在打电话给客户,或者有交易在进行中……无论欺诈行为如何,如何将模型的输出集成到实际操作中,以便是否可以在您必须处理的实时或接近实时的环境中使用?

我认为我可能无法提供许多有关欺诈建模的细节……

别担心。而且我不确定这是否是一个公平的问题,因此,如果您愿意,您可以继续进行下去……因为在某些情况下,当我们与人们聊天时,我们不知道他们的具体领域是什么,并且不是。因此,直接讨论模型问题-讲完,提到实时功能...此时会发生什么?不只是模型本身,还包括模型的输出-在现实世界中如何使用?对于目前没有这种能力的公司来说,这是什么样的呢?模型输出和实时处理人员的集成看起来像什么?

[]当然。我想我将回到数字资产上的个性化示例,在该示例中,数据科学家实际上正在构建一流的模型。因此,他们几乎要解决给定的问题,即您想为客户显示相关内容,那么当客户在渠道上时,您将如何真正地确定当时的相关内容呢?

但是,当我们构建此模型时,您希望能够实时运行该模型,以便能够浮现数字资产上的内容。这就是工程的整个架构设计发挥作用的地方,我们与技术合作伙伴紧密合作,我们在技术上真正地实时对模型进行评分,数据在实时进行中,并且我们可以从网站或移动应用程序上提供的所有内容中找出要为该客户显示的内容是什么。因此,您会想像,生态系统中尚存在一种完善的功能,该功能实际上正在运行所有这些逻辑,并为该客户提供内容。我认为这才是真正的一切。

就像您想象的那样,有一些团队是数据科学家,一些团队是营销团队,他们实际上是在弄清楚内容。我们的技术合作伙伴确实在设计这个生态系统,以便使所有这些功能协同工作,以将内容显示在我们的数字资产上。

好吧,正如克里斯所知道的,我通常是一个对实用性感兴趣的人……而您提到的那个数字仍然留在我的脑海中,而且这种实时性……我知道有很多人在外面那里并没有进行如此大规模的推理和实时的工作,但是他们仍然想要–也许他们正在将模型集成到Web应用程序中,但他们仍然希望Web应用程序能够响应...或者重新尝试随着公司的成长而扩大规模。

我不想错过这个机会,问您,随着时间的推移,您逐步扩大这些模型的范围,是否可以提供给实践者任何类型的实用技巧,甚至只是团队领导,您可以使用给他们一个这样的信息,使他们不会构建他们从未从中受益的模型和模型集成,因为他们需要15秒钟来进行推理或其他操作……您知道,他们从未集成过。

您所做的事情是我们很多人都没有做过的,只是规模和性能水平。

是的,那么那里有什么技巧,或者关于团队指导的任何想法? 绝对。 我认为AI / ML模型的前提条件不仅是您正在运行实时应用程序。 我认为,即使它们以批处理方式运行,也存在许多AI / ML模型,这意味着它们每个月运行一次。 但是我认为我想给的第一个也是最重要的提示是问自己这个业务问题是否真的需要任何AI / ML模型。 我认为这很关键。 []我认为我们生活在一个有时无法很好地解释AI / ML模型的空间中,因此,我们需要对进入模型的数据,我们正在建立的属性清楚地了解 数据,所以 ......