Select Star会播种以自动为数据科学家记录数据集

2021-02-25 01:00:58

今天,在一个现代化的,数据密集型组织中,“ SELECT *”将杀死您。有了PB级的信息,成千上万个表(在另一面!)以及数据库服务器上引发了数百万甚至数十亿个调用,数据科学团队将不再只是索要所有数据并立即开始使用它。

大数据导致了数据仓库和数据湖(以及显然是数据湖的房屋),使访问数据更加健壮和轻松的基础架构的兴起。但是,仍然存在编目和发现问题-仅仅因为您将所有数据都放在一个地方并不意味着数据科学家知道数据代表什么,谁拥有它,或者这些数据可能在无数的Web和网络中影响什么?在此基础上构建的公司报告应用程序。

这就是Select Star的来历。这家初创公司成立于大约一年前,于2020年3月成立,旨在在数据仓库的上下文中自动构建元数据。从那里开始,它提供了全文本搜索,使用户可以在其搜索结果中快速查找数据以及“热图”信号,从而可以快速查明数据集中哪些列是公司中的应用程序使用最多且拥有最多的引用它们的查询。

该产品是SaaS,旨在通过连接到客户的数据仓库或商业智能(BI)工具来快速入门。

唯一的创始人兼首席执行官Shinji Kim解释说,该工具是她在公司数据科学团队中直接看到的一个问题的解决方案。她曾创建过Concord Systems,这是一家实时数据处理初创公司,于2016年被Akamai收购。“我注意到的部分是,我们现在拥有所有数据,并且具备计算能力,但是现在下一个挑战是她知道数据是什么以及如何使用。”

她说,“在成长中的公司中,部落知识正变得越来越浪费时间和痛苦”,并指出,Facebook,Airbnb,Uber,Lyft,Spotify等大公司已经建立了自己的自制数据发现工具。她对Select Star的任务是使任何公司都能快速利用易于使用的平台来解决此问题。

该公司筹集了250万美元的种子资金,由Bowery Capital领投,由Background Capital和许多著名天使投资人参与,包括Spencer Kimball,Scott Belsky,Nick Caldwell,Michael Li,Ryan Denehy和TLC Collective。

多年来,数据发现工具已经满足了某种形式,多年来,具有升高数百万VC美元的热门公司。 Kim看到了一个机会,通过提供更好的船上体验,并且还可以自动化工作流程的大部分工作流程,该工作流程是许多替代数据发现工具的手册。通过许多这些工具,“他们不做连接和建立关系的工作,”在她说的数据之间,添加“文档仍然很重要,但能够自动生成[元数据]允许数据团队获得价值马上。”

除了了解数据外,选择Star还可以帮助数据工程师开始弄清楚如何更改其数据库而不会导致级联错误。该平台可以识别如何使用列以及如何改变一个可能会影响其他应用程序甚至是其他数据集。

选择明星今天出于私人测试版。该公司的团队目前有七个人,Kim表示,他们专注于成长团队,并在年底之前更容易登上用户。