欢迎来到我们的两个以数据为中心的博客系列,在那里我们剥离了每层Fluree的数据中心架构堆栈。我们的第一部分是“以数据为中心的信任”,描述了数据出处,谱系和治理周围的概念是健康数据生态系统的核心。今天,我们将专注于通过练习语义互操作性来使数据对广泛的消费者有用。
数据集成现在超过了平均IT部门预算的三分之一,当时应该在创新方面。为什么?我们的系统并未本地谈论相同的语言。
为了实现越来越常见的需要组合不同数据的需要,软件开发人员由建立和维护模式翻译中间件和数据科学家们忙于自己减少,清洁和协调。
计算机系统一直在努力格式化差异和歧义,类似于人类语言障碍甚至文化语义 - 英国(碎片炸土豆)与“芯片”(薄,从罐头烘焙土豆) /包)。当信息需要整合到系统上时,缺乏普遍的理解可以为企业数据团队创造难以想象的成本和头痛。
语义互操作性是系统通过使用通用标准将信息与共享含义交换信息。在语义实现中,数据到达预先包装的自我描述上下文,并且该信息的消费者可以通过通用词汇量从该数据中导出意义。
语义图是数据库内的语义关系网络。重要的是,语义图形不仅定义了数据元素之间的关系和上下文,还可以在图表中存储这些关系。
语义图是强大的,灵活的工具,为数据,关系和含义提供了一个家庭。语义图提供了富有的关系的查询,而无需联合或关系数据库所需的主/外键。如果您正在处理丰富的数据,则语义图技术将削减查询延迟并提供更大的洞察力。
本体是共享词汇表,提供语义能力的系统,以便在上下文中定义和代表数据;他们向我们提供一种方法,可以在给定域中正式代表概念。本体有助于在单个词汇量下撰写常见数据的常见信息,以便这种不同和异构的系统可以轻松地互操作。
给定域内的一组本体的一个例子将是FIBO,金融业商业本体,由EDM理事会的商标努力。 FIBO努力解决了行业数据存储库庞大的财务术语的复杂性,提高了分析和业务应用的数据质量。
RDF是一种数据模型,表示“三元杂志”中的介词数据。这些三元组基本上是关于一个事实的断言。例如,Fluree使用主题谓词对象。
Fluree实际上扩展了这个三倍以包括有关时间的信息,以允许缩回事实并支持可扩展元数据包含。 RDF是令人难以置信的灵活性,因此可以成为RDF-Graph的基础,这是一组互连的三元组。作为代表信息的普遍方式,RDF可以为表达本体提供优异的模型。有关RDF的更多信息:
知识图形是与本体对齐的语义图。知识图形本质上是通过语义图形格式和本体规则实现的数据统一,分析和共享的全集成平台。
创建或映射到语义本体的前置努力可能看起来繁重(并且它可能非常适合一个简单的应用程序堆栈。)您应该考虑语义实施的前三个区域在数据交换,数据联合会下数据推断。
您的数据是否需要与其他来源进行互动?语义系统能够自动解释传入数据的含义,使您的数据未来证明用于任何消费者。语义数据交换绝对必需的机器<机器通信框架,其中在具有有限或没有人类交互的系统之间流动的数据流动。
语义数据集成提供了组合数据源的无缝和自主方式,并将其呈现给应用程序,就像它们被从相同的源中拉出一样。例如,Fluree对SPARQL的支持允许查询击中多个数据源并在单个响应内返回组合结果。
遵守共享词汇表的语义网络技术可以自动“填写”的关系一组规则。 W3C提供了自动数据推理的两个完美示例:
要考虑的数据集可以包括关系(Flipper ISA海豚)。本体可能声明“每只海豚也是哺乳动物”。这意味着语义Web程序了解“x的概念”也可以将语句(鳍ISA哺乳动物)添加到关系集中,尽管这不是原始数据的一部分。人们还可以说“发现了新的关系”。另一个例子是表达[该事实,即“如果两个人具有相同的名称,主页和电子邮件地址,则它们是相同的”。在这种情况下,可以通过推理来发现两个资源的“标识”。
资料来源:W3C.
练习语义互操作性允许组织将数据视为各种系统可以使用和重用,组合,交换和理解的生活资产。语义数据存储库Bolster分析能力,简化了各种来源的整合,并最终为数据以来为中心的生态系统提供了基础。一些好处包括:
Fluree是一个语义RDF图数据库,具有用于W3C数据标准的本机支持。 Bluree的数据平台上的组织建立了与其他基于标准的系统互操作性的即时好处。
Fluree的分类帐文件仍然处于RDF数据格式标准,即使在潜在的模式不同时,旨在促进通用数据互操作性的W3C标准。因此,Fluree中的数据互操作性是本机,启用链接数据,共享词汇表,推理,本体,分散标识符和可验证凭据。复杂和多模态查询的数据不仅可以互操作各种氟丝仪和数据存储,而且可以在全球范围内与相同的W3C标准构建的任何其他数据互操作。
Fluree的可扩展元数据模型(RDF ++)还允许进行数据管理的公平原则(制作数据和元数据找到,可访问,可互操作和可重用)。 感谢您花时间读取语义互操作性,第二层在Fluree的以数据为中心的架构中。 下个月,我们将介绍以数据为中心的安全性。 根据开源许可,弗拉在开放和可用。 未来的数据平台 - 现在可以访问所有数据平台。 阅读更多> 一个统一的通信套件,符合Web 3.0标准,并使用区块链技术来赋予用户隐私和安全性 阅读更多>