AWS通过用于机器学习的端到端功能扩展了SageMaker功能

2020-12-09 05:02:41

随着机器学习逐渐成为主流,组织中的业务部门将找到自动化应用程序,AWS试图为其客户简化这些定制应用程序的开发。

AWS机器学习副总裁Swami Sivasubramanian说:“像SageMaker这样的被广泛采用的服务,最好的部分之一就是,我们得到了很多客户建议,这些建议推动了我们的下一批交付品。” “今天,我们发布了一套适用于Amazon SageMaker的工具,可使开发人员更轻松地构建端到端机器学习管道,以准备,构建,训练,解释,检查,监视,调试和运行自定义机器学习模型具有更大的可见性,可解释性和大规模的自动化。”

根据AWS的数据,诸如3M,ADP,AstraZeneca,Avis,Bayer,Capital One,Cerner,Domino's Pizza,Fidelity Investments,Lenft,T-Mobile和Thomson Reuters之类的公司已经在自己的运营中使用SageMaker工具。

该公司的新产品包括Amazon SageMaker Data Wrangler,该公司表示,该产品提供了一种标准化来自不同来源的数据的方法,因此数据始终易于使用。 Data Wrangler还可以简化将不同数据源分组为功能以突出显示某些类型的数据的过程。 Data Wrangler工具包含300多个内置数据转换器,可以帮助客户在无需编写任何代码的情况下进行功能标准化,转换和组合。

亚马逊还推出了Feature Store,该功能允许客户创建存储库,从而更轻松地存储,更新,检索和共享机器学习功能以进行培训和推理。

Amazon Web Services吹捧的另一个新工具是其工作流管理和自动化工具箱Pipelines。 Pipelines技术旨在提供与传统编程相同的编排和自动化功能。该公司在一份声明中说,使用管道,开发人员可以定义端到端机器学习工作流程的每个步骤。开发人员可以使用这些工具通过相同的设置从SageMaker Studio重新运行端到端工作流,每次都获得相同的模型,也可以使用新数据重新运行工作流以更新其模型。

为了解决人工智能和机器学习模型中长期存在的数据偏差问题,亚马逊推出了SageMaker Clarify。该工具于今天首次发布,据称可以在整个机器学习工作流程中提供偏差检测,因此开发人员可以着眼于如何更好地透明化模型的建立。亚马逊承认,有开源工具可以进行这些测试,但是这些工具是手动的,需要开发人员的大量帮助。

其他旨在简化机器学习应用程序开发过程的产品包括SageMaker Debugger,它使开发人员可以通过监视系统资源利用率并警告开发人员潜在的瓶颈来更快地训练模型。分布式培训,通过跨多个GPU自动拆分数据以加快培训时间,可以比当前方法更快地培训大型,复杂,深度学习模型; SageMaker Edge Manager,这是一种用于边缘设备的机器学习模型管理工具,它使开发人员可以优化,保护,监视和管理部署在边缘设备群上的模型。

最后但并非最不重要的一点是,亚马逊推出了SageMaker JumpStart,它为开发人员提供了一个可搜索的界面,以查找算法和示例笔记本,从而使他们可以开始进行机器学习。该公司表示,它将为刚接触机器学习的开发人员提供选择多个预先构建的机器学习解决方案并将其部署到SageMaker环境中的选项。