人工智能公司Synerise是中东欧增长最快的公司之一,以其AI增长生态系统而闻名。Synerise是一个开源的Cleora AI项目,这是一个机器学习工具,可以更快、超容易地为大型图形生成图形嵌入。Synerise在过去的几年里一直致力于这个项目,并开发了一个简单易用的框架,可以不受限制地应用于任何数据集。
Cleora是一种通用模型,用于高效、可扩展地学习异构关系数据的稳定和归纳实体嵌入。该框架利用极快、稳定和迭代的随机投影将实体嵌入到n维球形空间中,从而获得无与伦比的性能和可扩展性。该工具可以在一台机器上嵌入极大的图形和超图形。
在Synerise,我们相信在开源的Cleora框架中分享知识和展示创新将帮助许多公司在人工智能领域开发出令人惊叹的、更快的解决方案。-芭芭拉·里查尔斯卡(Barbara Rychalska)-Synerise的人工智能研究科学家。
Cleora生成的嵌入与Node2vec、word2vec、DeepWalk或此类中的其他系统生成的嵌入有许多关键属性不同:
感应性-由于实体的Cleora嵌入仅通过与其他实体的交互来定义,因此可以即时计算新实体的矢量,
可更新性-刷新实体的Cleora嵌入是允许实时更新而无需重新训练的非常快速的操作,
稳定性--实体的所有起始向量都是确定性的,这意味着类似数据集上的Cleora嵌入最终将是相似的。像word2vec、Node2vec或DeepWalk这样的方法每次运行返回不同的结果,
跨数据集组合性-由于Cleora嵌入的稳定性,同一实体在多个数据集上的嵌入可以通过平均、产生有意义的向量、
模糊独立性--多亏了产生Cleora嵌入的过程,每个维度都独立于其他维度。该特性允许将多视图嵌入与Conv1d层相结合的高效且低参数的方法,
极高的并行性和性能--Cleora是用Rust编写的,除了输入文件加载外,所有计算都使用线程级并行性。实际上,这意味着嵌入过程通常比加载输入数据更快。
从最终用户的角度来看,Cleora Embedding的主要可用性特性可以概括为:
结果质量优于或优于其他嵌入框架,如PyTorch-BigGraph、GOSH、DeepWalk、LINE、。
Synerise It将Cleora定位在与科技巨头并驾齐驱的顶端。结果的质量优于其他嵌入框架,或者与其他嵌入框架相比具有竞争力。这篇包含细节的科学论文将在两周内发表。该解决方案的源代码已经在Synerise GitHub账户上提供。
Cleora算法的创新性得到了强有力的证实,那就是我们将它们作为Synerise AI Growth生态系统的一部分。我们不仅在观察发生在我们周围的现实方面走在了前列,而且在创造现实的过程中为科学和技术做出了真正的贡献。Jacek DąBrowski--协和公司的首席人工智能官。
Cleora由Synerise用于内部目的,与Terrary DB合作,实时处理数十亿个数据点,并解决涉及图形数据的多模式挑战。Cleora算法非常灵活,可以应用于不同的细分市场,特别是:零售、银行和电信规模的行为数据(数十亿个实体、数万亿个互动)。Cleora还被广泛用于Emde(高效流形密度估计)中的输入嵌入,该Emde也是由Synerise团队创建的。