面向所有人的人工智能基础设施,现在是开源的

2020-05-02 17:52:39

缺乏软件基础设施是实现人工智能巨大潜力的根本瓶颈--谷歌(Google)、Facebook和微软(Microsoft)等科技巨头也没有忽视这一事实。这些精英公司投入了大量资源和专业知识来构建专有的、人工智能原生的内部基础设施,并已经通过变革性的人工智能支持的应用程序和富有成效的深度学习工程师的形式收获了好处。对于其他不能使用这个基础设施的人来说,建造实用的.。

三年前,我们开始决心将人工智能原生软件基础设施带到更广泛的市场。与多个行业的尖端深度学习团队密切合作,出现了一个清晰的叙述:随着组织从研究转向生产,如果没有更好的基础设施,大规模培训深度学习模型仍然极其困难。这一反馈使我们建立了坚定的培训平台,该平台现在为深度学习工程师团队和大型GPU集群提供动力……。

我们的创新基础设施平台现已准备好广泛采用,我们很高兴能与DL社区分享!今天我们宣布,我们已经在Apache2.0许可下开源了我们的深度学习培训平台。

我们设计了坚定的培训平台,让深度学习工程师专注于手头的任务,培训高质量的模型。为实现这一目标,我们的平台紧密集成了DL工程师大规模培训模型所需的所有功能,包括:

Defined的分布式培训支持建立在流行的分布式培训框架Horovod的基础上,但包括一套优化,使性能是普通Horovod的两倍。此外,Desired的分布式训练支持很容易设置(从单GPU到分布式训练不需要更改代码),并且允许多个用户无缝共享同一个GPU集群。我们的一位顾客看到了一个..。

最先进的超参数搜索。Desired的搜索功能建立在我们过去十年的尖端研究基础上。1、2、3、4、5我们的超参数搜索与我们的作业调度程序紧密集成,并且默认情况下是并行的-因此,您可以比标准搜索方法快100倍,比贝叶斯优化方法快10倍,从而获得更精确的模型。

个人和团队的DL工具。Desired通过实验跟踪、日志管理、指标可视化、重复性和依赖性管理,帮助您在实验管理方面出类拔萃。这些工具提高了各个DL工程师在项目生命周期内的工作效率,对不断成长的团队进行高效协作和扩展至关重要。

不限硬件,并与开源生态系统集成。Desired支持公共云和本地基础架构,这意味着您可以避免受困于专有解决方案。此外,Desired可以与您选择的DL框架配合使用,可以导出到流行的服务框架,并且更广泛地集成了各种数据准备和模型服务技术(请参见下图)。

坚定的培训平台已经为创新公司的数百个GPU提供了动力。以下是我们的两个现有客户如何将Desired的平台整合为其DL工作的核心部分的一些见解:

有了人工智能处于Recursion生物制药愿景的前沿,我们用决心管理100个内部GPU,以及动态扩展以使用谷歌云平台上的GPU。使用Desired对分布式训练的本地支持,我们能够将关键计算机视觉模型的训练时间从3天减少到3小时,而无需更改我们的模型代码。“-Ben Mabey,Recursion临时CTO。

通过采用Desired AI的软件平台,我们的深度学习工程师团队能够迅速向我们的客户提供新的、先进的工业物联网产品。我们交付新的人工智能功能的速度比以前快了10倍。“--Compolology首席产品官Ben Chehebar。

我们期待着共同建设人工智能原生基础设施的未来。我们邀请您在GitHub上查看我们,安装产品,并阅读文档。如果您有反馈或遇到问题,请加入我们的“决心社区松弛”或在邮件列表上发帖。

用于大规模并行超参数调谐的系统。首页--期刊主要分类--期刊细介绍--期刊题录与文摘--期刊详细文摘内容。机器学习与系统会议(MLSys),2020年。

2神经结构搜索的随机性和重复性。L.Li,A.Talwalkar.。人工智能不确定性会议(UAI),2019年。

3Hyperband:基于Bandit的超参数优化配置评估。首页--期刊主要分类--期刊细介绍--期刊题录与文摘--期刊详细文摘内容。国际学习代表会议