差分数据流是一个库,可让您编写简单的数据流程序,并且a)然后并行运行它们,并且b)在新输入到达时有效地更新输出。与spark和kafka流之类的竞争产品相比,它可以处理更复杂的计算,并在占用更少内存的情况下显着提高吞吐量和延迟。
但是,我只知道有几家公司在生产中使用了它,尽管它已经存在了5年。
更令人惊讶的是,没有人将这些想法复制到某种对企业友好的Java怪诞之中,尽管事实上差异数据流是开源的,并且在许多论文和博客文章中都有深入的解释。
我很感兴趣,因为物化正在花费大量的精力在差分数据流之上添加一个SQL层。对于喜欢SQL的人来说,这一切都很好,但是我很好奇是否还有可能对javascript / python / R绑定和良好的教程感到满意的潜在用户吗?