2022-2-26 9:5Braintree Payments使用PostgreSQL作为其主要数据存储。我们严重依赖传统关系数据库提供的数据安全性和一致性保证,但这些保证会带来一定的操作困难。为了让事情变得更有趣,我们允许我们的主要支付处理服务实现零计划功能停机。
几年前,我们发表了一篇博客文章,详细介绍了我们在不中断生产API流量的情况下......
2022-2-17 12:7当你通过我们的网站购买一本经过独立评审的书时,我们将获得会员佣金。
《索引》是丹尼斯·邓肯(Dennis Duncan)所著的一部从中世纪手稿到数字时代的书卷冒险史。344页。W.W.诺顿公司;公司$30
在阅读丹尼斯·邓肯(Dennis Duncan)的新书《索引,一部历史》(Index,A History of ......
2022-2-17 10:55下载PDF摘要:在本文中,我们证明了信息检索可以通过一个转换器来完成,其中关于语料库的所有信息都编码在模型的参数中。为此,我们引入了可微搜索索引(DifferentiableSearch Index,DSI),这是一种学习文本到文本模型的新范式,该模型将字符串查询直接映射到相关文档ID;换句话说,DSI模型只直接使用......
2021-8-10 1:21矢量相似性搜索改变了搜索领域的游戏规则。它使我们能够有效地搜索范围广泛的媒体,从 GIF 到文章——对于超过 10 亿大小的数据集,在亚秒级时间尺度上具有令人难以置信的准确度。高效搜索的关键组成部分之一是灵活性。为此,我们有广泛的搜索索引可供我们使用——在相似性搜索中没有“一刀切”。然而,这种巨大的灵活性产生了一个问......
2021-8-8 23:51一个全新的搜索引擎架构会是什么样子?谁能比 Algolia 的联合创始人兼首席技术官 Julien Lemoine 更能描述搜索的未来。这是该系列的第一篇文章。搜索引擎,更普遍的信息检索系统,在当今几乎所有的技术栈中都发挥着核心作用。信息检索始于计算机科学之初。随着文本检索会议 (TREC) 的推出,研究在 90 年......
2021-7-27 9:29Index Pick and Place 是一种开源的拾取和放置机器,用于帮助中型制造。这个项目正在开发中。它目前处于不稳定状态。开发是积极和持续的,但这还不是一个完成的设计。如果您想构建一个来帮助查找错误和设计问题,请这样做!请在这里阅读维基! wiki 包含有关项目状态的信息、提供的说明和常见问题解答。该指数的设......
2021-7-27 6:13我不得不承认,我的研究博客文章越来越长。从一方面来说,我觉得这真的很令人鼓舞,因为如果仅仅通过抓住主题就可以获得如此多的信息,想象一下隐藏在表面之下的东西!一位大学教授曾经说过“数据库中有什么有趣的东西?”,结果令人毛骨悚然!另一方面,它肯定会给潜在读者带来问题。为了克服它们,我建议采用一种有趣的方法:将这篇博文打印......
2021-7-25 23:30你在运营。像往常一样在 Invoicing Rails 应用程序中调试 Error-s。它们存储在 MySQL 中并通过 ActiveRecord 和一些辅助方法访问。他们已经用 status_message 更新了,所以现在是深入研究的时候了。在另一个创纪录的热浪下午,阳光透过你的窗户照射进来,但你却像黄瓜一样凉爽......
2021-6-30 4:16赖斯大学计算机科学家正在派遣兰博,以拯救有时等待几天或几周的基因组研究人员,以获得巨大的DNA数据库的搜索结果。 DNA测序是如此流行的,基因组数据集每两年倍增一次,以及数据哈比的工具' T保持速度。将DNA与基因组或研究生物体的演变相比,如病毒的进化,导致Covid-19通常等待的软件,以索引大量的软件,&......
2021-5-15 10:14在Web应用程序中,面对我们无法理解的性能问题并不罕见。特别是与数据库一起使用,我们将它们视为这个巨大的“黑匣子”,99%的时间令人惊讶地毫无疑问地关心它。哎呀,我们甚至使用像orms的东西,基本上“隐藏”我们与数据库的互动,让我们认为我们不需要关心这些东西。
如果你正在开发一些小的,所在的东西,简单,那可能是这种......
2021-5-7 18:21doaj是一个社区策划的在线目录,可索引并提供高质量,开放式访问,同行评审的期刊。 所有DOAJ服务都是免费的,包括被索引。 所有数据都可以自由使用。
2021-4-23 0:28创建表表(列向量(3)); 使用ivfflat(列)在表上创建索引; 按列< - > ' [1,2,3]' 限制5; 注意:<#> 返回消极的内部产品,因为Postgres仅支持ASC订单索引扫描在运营商上 使用近似索引加快查询。 为要使用的每个距离功能添加索引。 在表格......
2021-4-15 22:21在Web应用程序中,面对我们无法理解的性能问题并不罕见。特别是与数据库一起使用,我们将它们视为这个巨大的“黑匣子”,99%的时间令人惊讶地毫无疑问地关心它。哎呀,我们甚至使用像orms的东西,基本上“隐藏”我们与数据库的互动,让我们认为我们不需要关心这些东西。
如果你正在开发一些小的,所在的东西,简单,那可能是这种......
2021-4-8 21:6VALD具有自动矢量索引和索引备份,以及用于搜索数十亿个特征矢量数据的水平缩放。 通常,图表需要在索引期间锁定,这导致阻止世界。 但Vald使用分布式索引图,因此在索引期间继续工作。 VALD有一个功能,可以使用MySQL或Cassandra存储索引数据的备份,从而实现灾难恢复。 在第一次提交到此存储库之前,强......
2021-1-28 21:59分段几何模型索引(PGM-index)是一种数据结构,它可以使用比传统索引少的数量级空间,对数十亿个项目的数组进行快速查找,前身,范围搜索和更新,同时提供相同的最坏情况查询时间保证。
与传统的基于树的索引不了解输入数据中可能存在的规律性不同,PGM索引在索引键及其在内存中的位置之间利用了学习的映射。这种映射的简洁性......
2021-1-19 18:2最近,AndréGarzia发表了一篇不错的博客文章,名为“ Lua,一种被误解的语言”,不幸的是(但不足为奇),HN对此发表了大量评论,涉及的是基于0和1的古老索引问题。您会看到,Lua使用基于1的索引,许多程序员声称这是不自然的,因为“其他语言”都使用基于0的索引。
我将很快撇开事实并非如此-基于1的索引具有悠......
2020-12-15 5:44支持空间数据和空间索引是CockroachDB历史上最需要的功能之一。 CockroachDB中要求空间数据的第一个问题于2017年10月打开,并于2020年11月12日随着CockroachDB 20.2中空间数据存储的发布而关闭。
空间数据有时也称为地理空间数据,是包含有关地理(和几何)特征的信息的数据,而P......
2020-11-30 23:53我必须承认,我的研究博客帖子越来越长。从一方面来看,我发现这确实令人鼓舞,因为如果只是从头开始就获得大量信息,请想象一下隐藏在表面下的东西!一位大学教授曾经说过:“数据库中可能有什么有趣的东西?”,事实证明吓坏了很多!另一方面,它肯定会给潜在读者带来问题。为了克服它们,我建议一种有趣的方法:打印此博客文章,或在平板电......
2020-9-19 3:10RediSearch是一个实时二级索引,具有针对Redis的全文搜索功能,是最成熟、功能最丰富的Redis模块之一。它也变得越来越受欢迎-在过去的几个月里,RediSearch Docker的拉动量跃升了500%!这种飙升的受欢迎程度导致客户提出了各种各样有趣的用例,从实时库存管理到短暂搜索,应有尽有。
为了延续这一......
2020-9-15 6:45SQL索引是最有效的调优方法,但在开发过程中经常被忽略。使用索引,Luke从头到尾解释SQL索引,而不是停留在Hibernate这样的ORM工具上。
使用索引,Luke是SQL性能解释的免费网页版。如果你喜欢这个网站,可以考虑买这本书。还可以看看商店里有没有其他支持这个网站的很酷的东西。
使用索引,Luke以供应商不......
2020-9-8 11:13如果您是一名应用程序开发人员、分析师、数据科学家或任何必须弄清楚如何使用关系数据库的人,那么您很有可能熟悉索引。至少在一定程度上,您知道它们以某种方式帮助加快了您的查询速度。(这就是我在很长一段时间内对索引的理解之处)。您可能已经看到,PostgreSQL会自动为具有主键或唯一约束的列创建索引。但只要再深入一点,你就......
2020-9-7 10:57PostgreSQL 13开发进展顺利,Postgres 13 Beta3于2020年8月13日发布。Postgres Beta 1和2版本分别于2020年5月和6月发布。我对Postgres 13感兴趣的功能之一是B-Tree重复数据删除功能。B-Tree索引是Postgres中的默认索引方法,也可能是生产环境中最......
2020-7-25 7:12匈牙利顶级新闻网站Index的70多名记者和员工辞职,指责政府发起摧毁或驯服他们网站的行动。
索引号是匈牙利最后一家主要的独立媒体和主编,周二被解雇。
它的记者说,解雇是明显的干扰,并试图对该网站施加压力。
在过去的十年里,民族主义和保守主义总理维克多·欧尔班的支持者逐渐控制了匈牙利的独立媒体。在记者无国界世界新闻自......
2020-7-24 23:35免责声明:我没有为Cognitect工作,不幸的是,我还没有看到Datomic的任何源代码。我刚刚通过大量的公开演讲、文档和谷歌小组对数据的回答才做到了这一点。这篇帖子是对这些内容的汇编。其目的是通过了解他人在做什么来帮助他们更有效地使用数据。
数据体将所有数据建模为称为数据的4元组(实体、属性、值、时间)。在“约翰......
2020-6-26 22:41搜索系统的关键指标之一是索引延迟,即新信息在搜索索引中可用所需的时间。此度量很重要,因为它决定了新结果显示的速度。并不是所有的搜索系统都需要快速更新内容。例如,在仓库库存系统中,每天更新一次搜索索引可能是可以接受的。就像Twitter--人们不断地在寻找“发生了什么”的答案--实时搜索是必须的。
直到2019年年中,......
2020-6-21 0:29本文的目的是促进更好地理解ElasticSearch中的事情是如何工作的。如果您正在阅读本文,您可能已经知道ElasticSearch是如何工作的,如果不是这样,您可以通过阅读下面的文章来了解更多:
Lucene是ElasticSearch的基础,但您在开车时不能直接与他交互,也不能要求直接启动引擎。但是如果你的车坏......
2020-6-14 11:4跳到导航跳转到搜索索引图书馆Prohibitorum(禁书清单)是一份被索引神圣教会(前罗马教廷修道院)视为异端或违反道德的出版物清单,天主教徒被禁止未经许可阅读这些出版物。[1]。
在16世纪之前,有人试图审查个别书籍,特别是9世纪的“Glasianum Decretum Glasianum”,但这些都不是官方的,......
2020-6-11 3:37Apache Pinot是一个实时分布式OLAP数据存储,旨在以低延迟提供可扩展的实时分析。
Pinot通过其在非BLOB列上的索引支持超快的查询处理。具有精确匹配过滤器的查询通过字典编码、倒排索引和排序索引的组合高效运行。但是,任意文本搜索查询不能利用索引,需要全表扫描。
在这篇文章中,我们将讨论在Pinot中新增......