处理PB级数据以生成业务见解既昂贵又耗时。更糟糕的是,所有散布在周围的数据为全球每个黑客群体在公司的背面描绘了一个巨大的鲜红色目标。大数据的维护成本高昂,保护成本高昂,而私有数据维护成本高昂。而且最终的结果可能不会那么多,通常,经过精心挑选的精选数据集比无休止的原始数据提供更快,更好的洞察力。
公司应该怎么做?好吧,他们需要补品来缓解大数据方面的缺陷。
Tonic是一个“综合数据”平台,可以将原始数据转换为软件工程师和业务分析师可以使用的更易于管理的私有数据集。在此过程中,Tonic的算法会取消识别原始数据,并创建统计上相同但合成的数据集,这意味着个人信息不会被不安全地共享。
例如,一个在线购物平台将具有其客户及其所购买商品的交易历史记录。与公司中的每个工程师和分析师共享该数据非常危险,因为购买历史记录可能会亲自识别出任何细节,而无需知道的人都无法访问这些细节。 Tonic可以获取原始付款数据,并将其转换为统计属性完全相同但与原始客户无关的较小数据集。这样,工程师可以测试他们的应用程序,或者分析师可以测试他们的营销活动,而所有这些都不会触发对隐私的担忧。
近几个月来,合成数据和其他处理大型数据集隐私的方法引起了投资者的广泛关注。我们上周在Skyflow上进行了报道,该报告提出了一轮使用多态加密的方法,以确保员工只能访问他们需要的数据,而无法访问其余数据。 BigID具有更全面的观点,即仅根据本地隐私法跟踪什么数据在哪里以及谁应该访问它(即数据治理)。
随着数据集变得越来越大,Tonic的方法不仅可以帮助解决隐私问题,还可以帮助解决可伸缩性挑战。这次合并吸引了投资者的注意:今天早上,该公司宣布已在GGV的Glenn Solomon和Oren Yunger领导的A轮融资中筹集了800万美元,后者将加入公司董事会。
该公司由四位创始人于2018年创立:首席执行官Ian Coe与COO Karl Hanson(他们也是在初中相识)和CTO Andrew Colombi一起工作的,当时他们都在Palantir工作,Coe之前也曾与公司的合作在Tableau期间的工程主管Adam Kamor。在Valley的一些最大,最成功的数据基础架构公司进行的培训构成了Tonic产品DNA的一部分。
Coe解释说,Tonic旨在防止现代软件工程中出现的一些最明显的安全漏洞。除了为工程团队节省数据流水线时间外,Tonic“还意味着他们不必担心敏感数据从生产环境转移到安全性始终比生产系统低的较低环境中。”
他说,后来成为补品的想法是在对Palantir银行客户进行问题排查时提出的。他们需要数据来解决问题,但是该数据非常敏感,因此该团队最终使用合成数据来弥合差异。 Coe希望以更严格的方式将合成数据的用途扩展给更多人,尤其是考虑到如今的法律变化。他指出,“我认为监管压力确实在促使团队改变他们的做法”。
Tonic技术的关键是其子集程序,它可以评估原始数据并开始以统计方式定义所有记录之间的关系。某些分析会根据数据源自动进行,并且在无法自动进行分析时,Tonic的UI可以帮助数据科学家使用数据集并手动定义这些关系。最后,Tonic会生成这些合成数据集,供公司内部所有该数据的客户使用。
有了新一轮的融资,Coe希望继续将易用性和新手入门经验加倍,并向客户宣传这种模式的好处。他说:“在很多方面,我们正在创建一个类别,这意味着人们必须理解并获得价值,并拥有早期采用者的心态。”
除了主要投资者GGV之外,彭博Beta,Xfund,Heavybit和硅谷CISO Investments以及天使投资人Assaf Wand和Anthony Goldbloom都参加了这一轮融资。