Snorkel AI评分为3500万系列B才能自动化机器学习中的数据标签

2021-04-08 00:46:26

它还宣布了一个名为Applications Studio的新工具,提供了一种使用模板和预定义组件构建公共机器学习应用程序的方法。

LightSpeed Venture Partners参与以前投资者Greylock,GV,Q-Tel和Nepenthe Capital的参与。新投资者瓦尔登和布莱克克罗克也加入了。启动报告现在已筹集了5000万美元。

公司联合创始人兼首席执行官Alex Ratner表示,数据标签仍然是移动机器学习和人工智能的巨大挑战和障碍,因为它是昂贵的,劳动密集型和努力为主题专家雕刻出来的去做吧。

“今天的AI不那么隐藏的秘诀在于,尽管所有技术和工具进步,但平均AI项目的成本和时间的大约80%到90%,只是手动标记和收集和重新标记了这一培训数据,”他说。

他说,他的公司制定了一个解决方案,简化了这一过程,使主题专家更容易以编程方式添加标签,他说的过程减少了从几个月到几小时或几天以相当戏剧性的方式申请标签所需的时间和精力,取决于数据的复杂性。

由于公司开发了这种方法,因此客户一直在进行机器学习过程的下一步中的帮助,该过程正在拍摄该培训数据和模型并构建应用程序。这就是应用程序工作室进来的地方。它可以是银行或网络异常探测器的合同分类器,它可以帮助公司在数据标签后拍摄下一步。

“这不仅仅是关于以编程方式标记数据的方式,它也是关于模型,预处理器,后处理器,因此我们现在已经使这是一个模糊和可视的缺口界面,”他说。

该公司的产品基于2015年在斯坦福AI实验室开始的研究。创始人在2019年推出浮潜之前在研究阶段度过了四年。今天,启动有40名员工。 Ratner认识到技术产业从多样性角度造成的问题,并表示他已经有意识地努力建立一个多样化的公司。

“我可以说的是,我们试图在公司一级,完整的团队一级和第一天的董事会层面优先考虑它,并将采取行动落后于此。因此,我们一直与外部公司合作进行内部培训和审计和战略,我们已经制作了管道多样性,与我们与招聘公司的任何合同的不可转让要求,“他说。

Ratner还认识到,自动化可以将硬代码偏差偏向机器学习模型,并且他希望通过简化标签过程,它可以在发生时更容易地检测到偏差。

“如果你从浮潜中呼叫标签函数的十几个或两次,你仍然需要警惕并积极地试图检测到偏见,但审计你的模型更容易通过退回来改变它来改变它看几百行代码。“