欢迎来到Gradient Ascent的第十版。我是前企业家兼现任投资者Albert Azout。我经常会遇到有趣的科学研究,解决重要难题的初创公司以及令我赞叹的技术。我对机器学习,高级计算,分布式系统和dev / data / ml-ops充满好奇和热情。在本新闻简报中,我旨在分享我所看到的内容,含义以及重要性。希望您喜欢我的漫步!
在学术研究的深处,人们对图(特别是知识图)上的机器学习兴趣重新出现。我花了几天的时间调查最新的工作(以及该主题之后的很多年)。我最近的生物分类之旅的快照如下:
世界上生成的大多数自然数据都可以表示为图形。存在几种图形,包括具有双向边和顶点的简单无向图,或边沿一个方向流动的有向图,或具有不同顶点类型或边类型的异构图等。
代表自然现象的现实世界图通常是具有非平凡拓扑结构的复杂网络(即大脑神经网络,蛋白质网络,社交网络等)。实际上,复杂的网络可以表示为有向的,多边(多边)图,其中节点和边在时间上共同发展(这本身就是一个有趣而密集的研究领域,涉及幂律度分布和比例缩放等主题。免费网络)。
就像传统的机器学习和计算机视觉从手工制作的功能演变为统计学习的功能,然后发展为具有多层非线性转换的更深层的网络一样,图学习也已从传统的图论方法演变为更复杂的(近似)消息-传递和图形嵌入技术。当神经网络的输入是图时,这些方法将关系归纳偏差(如视觉数据在卷积网络中的局部性和平移不变性)扩展到排列不变性。
节点/实体分类-根据结构图(和其他)特征将节点分类。节点分类与传统的监督或半监督分类有关。
链路预测-根据网络的结构特性预测节点之间的存在(或将来)边缘。
社区检测-将图划分为不同的(非重叠或松散重叠)子图。这与无监督或半监督群集有关。
图形嵌入-学习较低维度的图形表示(编码器)(通常是矢量表示)。图形嵌入用于下游任务(即解码器)。
使用专门的图运算符传递消息-利用图结构在节点之间传播信息,并使用一些运算符来转换消息。在神经网络中,可以学习算子的参数。
研究的一个有趣的子领域是知识图(KGs),这是一种专门用于编码人类知识的图。知识图将知识表示为事实网络,其中事实是(主题,谓语,宾语)三元组(即(特斯拉首席执行官Elon Musk))。 KG历史上是从语义网络中出现的,这些语义网络演变为语义Web和RDF架构/本体。最近,KG和RDF三元存储(利用Sparql查询)已放宽为带标签的属性图(图形数据库),这些属性图未实现正式的架构或提供唯一的(跨图)资源标识符-以及其他类似联邦的功能查询,验证,推理等。带标签的图使用更简单的查询语言(即Gremlin图遍历语言)。
设计了一些非常引人入胜的深度学习算法,以实现在知识图上嵌入图,包括由Amazon DGL-KE库实现并可以通过AWS Neptune ML使用的关系图卷积网络(R-GCN)。给定知识图的多关系结构,R-GCN图会在嵌入过程中累积跨关系的激活。我将在以后的文章中介绍其中一些算法。
随着企业被迫在其组织之间/之间表示/开发知识层,将人工生成的内容和语义层集成到各种企业技术和API之上,利用KG上的深度学习的技术将变得越来越关键。这些系统将提供自然的人机界面(即问题解答),该界面将了解人文环境和意图。