实际网络中发现的幂律的证据很少(2018)

2020-12-13 12:20:54

在幂律分布中,没有特征标度(因此称为“无标度”)。幂定律没有峰值-只是在较高的程度上减小,但是相对缓慢,并且如果放大其图的不同部分,它们看起来是自相似的。结果,尽管大多数节点仍具有较低的程度,但具有大量链接的集线器的确在各个规模上都以少量出现。

网络的无标度范式是在幂律在统计物理学中起着举足轻重的作用的历史时刻出现的。在1960年代和1970年代,他们在构成广泛物理系统相变基础的普遍定律中发挥了关键作用,这一发现使肯尼斯·威尔逊获得了1982年诺贝尔物理学奖。不久之后,幂律形成了席卷统计物理世界的另外两个范式的核心:分形和关于自然界中组织的理论,即自组织临界。

康奈尔大学数学家史蒂芬·斯特罗加兹(Steven Strogatz)说,当巴拉巴西(Barabási)在1990年代中期将注意力转移到网络时,统计学物理学家已经准备就绪,可以看到无处不在的幂定律。他说,在物理学中,有一种“幂律宗教”。

巴拉巴西(Barabási)的小组于1999年在《自然》杂志上发表了这项发现。一个月后,Barabási和他当时的研究生RékaAlbert(现为宾夕法尼亚州立大学的网络科学家)在《科学》杂志上写了一篇论文,此后被引用了30,000多次,功率定律不仅描述了结构的结构,万维网以及许多其他网络,包括电影演员的协作网络,美国西部的电网以及科学论文的引文网络。巴拉巴西(Barabási)几年后在《 Linked》中断言,大多数复杂的网络都遵循幂定律,幂指数通常在2到3之间。

阿尔伯特和巴拉巴西认为,一种称为“优先依附”的简单机制解释了为什么出现这些幂定律:当一个新节点加入网络时,它连接到一个显眼的高度节点的可能性要比晦涩,低度的节点高。节点。换句话说,富人变得更富裕,而集线器变得更富裕。

巴拉巴西(Barabási)小组在2000年7月27日出版的《自然》杂志上写道,无标度网络具有一些使其与其他网络区分开来的关键特性:它们同时具有鲁棒性,可以抵抗大多数节点的故障,并且易于受到针对集线器的针对性攻击。 《自然》的封面号称这最后一个属性是“互联网的致命弱点”(此特征一直受到互联网专家的广泛争议)。

巴拉巴西(Barabási)的工作使许多数学家,物理学家和其他科学家大为振奋,并在启动现代网络科学领域中发挥了作用。它发布了大量文件,断言一个真实世界的网络是无尺度的,这是一种优先的依恋关系,巴拉巴西的早期论文成为该中心的枢纽。波特说:“有一种潮流效应,人们在其中肆意地做事。”激动的情绪传播到了大众媒体上,谈论了自然界的普遍规律,并在《科学》,《新科学家》和其他杂志上刊登了报道。

但是,从一开始,无标度范式也吸引了许多人的反感。批评者指出,优先依附远非能产生幂律的唯一机制,而且具有相同幂律的网络可以具有截然不同的拓扑。一些网络科学家和领域专家对诸如电网,新陈代谢网络和物理互联网之类的特定网络的无标度表示怀疑。

其他人则反对缺乏统计严格性。当在“对数-对数图”(其中x和y轴具有对数标度)上绘制幂律时,它将变成一条直线。因此,要确定网络是否不具规模,许多早期研究人员只是盯着网络度的对数图。东京工业大学网络科学家Petter Holme回忆说:“我们甚至会从某个角度斜视计算机屏幕,以更好地了解曲线是否笔直。”

Clauset说:“必须有1000篇论文,人们在其中绘制学位分布,在其中划一条线,并说它是无标度的,而没有真正进行仔细的统计工作。”

针对这些批评,多年来,一些研究无标度的物理学家将注意力转移到了更广泛的重尾网络上。即便如此,对于不断增长的网络阵列,仍源源不断的论文断言无标度。

由于缺乏一致性,从一篇论文到另一篇论文,有关“无标度”的实际含义的讨论陷入了混乱。无标度网络是遵循指数幂介于2到3之间的幂定律的网络,还是遵循优先权依附关系生成幂律的网络?还是仅仅是遵循某些幂定律,或在某种程度上遵循幂定律或甚至更具有印象派意义的网络?

积极开展外展工作的Clauset发现,与他互动的许多学生仍然认为,权力定律的普遍存在是已解决的科学。他说:“下一代科学家对无标度网络的困惑让我震惊。”

反对无标度的证据散布在整个文献中,大多数论文一次只考察了少数几个网络。 Clauset有能力做一些更具雄心的事情:过去几年,他的研究小组策划了一个庞大的在线纲要,即《科罗拉多复杂网络索引》(ICON),其中包括4,000多个从经济学,生物学,交通运输和其他域。

他说:“我们希望将该假设视为可伪造的,然后评估所有领域的证据。”

为了测试无标度范式,他的研究生Clauset和Broido对近千个ICON网络进行了一系列日趋严格的统计测试,旨在衡量哪些(如果有的话)无标度定义可能合理。解释网络的学位分布。他们还将幂定律与其他几个候选者进行了比较,包括指数分布(尾部相对较细)和“对数正态”分布(尾部比指数分布重,但尾部比幂律更轻) )。

Broido和Clauset发现,在大约三分之二的网络中,没有幂律能够很好地拟合度分布。 (这并不意味着剩余的三分之一必须服从幂定律–只是不排除幂定律。)而且其他候选分布在许多网络上的性能均优于幂定律,对数正态击败了幂次对45%的网络实施法律,并在另外43%的网络上进行捆绑。

大约只有4%的网络满足Broido和Clauset的最强测试,该测试要求粗略地讲,幂律应在拟合优度测试中幸存下来,指数在2到3之间,并且要超过其他四个分布。

对于巴拉巴西(Barabási)而言,这些发现并未破坏无标度是许多或大多数复杂网络的基础的观点。毕竟,他说,在现实世界的网络中,唯一不会发生像优先附件这样的机制-其他过程通常会使网络脱离纯粹的无标度,使网络无法通过Broido和Clauset的测试。巴拉巴西说,网络科学家已经在数十个网络中找到了如何纠正这些其​​他过程的方法。

“在现实世界中,会有尘土和尘土,这些尘土将存在于您的数据中,”另一位物理学家转变为网络科学家的东北大学的亚历山德罗·韦斯皮尼亚尼说。 “您将永远看不到完美的幂律。”

作为一个比喻,巴拉巴西指出,即使万有引力定律说它们应该以相同的速度下落,但岩石和羽毛的下落速度却大不相同。他说,如果您不了解空气阻力的影响,那么“您会得出结论,引力是错误的。”

Clauset认为这种比喻没有说服力。 “我认为对于受过统计力学训练的物理学家来说,这是很普遍的……使用此类比喻来解释为什么不应该将他们的模型保持在很高的标准。”

Clauset说,如果您要观察1,000个掉落的物体,而不仅是岩石和羽毛,那么就会清楚地看到重力和空气阻力的工作原理。但是他和布罗伊多(Broido)对近1,000个网络的分析并没有产生类似的清晰性。 Clauset在推特上写道:“有理由相信一种基本现象将需要更少的定制侦探工作”。

他说:“默认且普遍的假设是所有网络都是无规模的,这取决于我们来弄清楚如何以这种方式看待它们-这听起来像是不可证伪的假设。”

Clauset和Strogatz说,如果测试拒绝的某些网络确实涉及其他力量覆盖的无标度机制,则这些力量必须相当强大。 “与我们在重力情况下看到的相反。。。在这里,主要的影响实际上是主要的,较小的影响实际上是很小的扰动,看起来网络发生的事情是没有单一的主要影响,” Strogatz说。 。

对于维斯皮尼亚尼来说,这场辩论说明了物理学家和统计学家的思想观念之间的鸿沟,他们两者都有着宝贵的观点。他说,物理学家正在努力成为“近似的艺术家”。 “我们想要找到的是一些组织原则。”

Vespignani说,无标度范式为更广泛的重尾网络应该如何表现提供了宝贵的直觉。他说,无标度网络的许多特征,包括鲁棒性和脆弱性的结合,都由重尾网络共享,因此重要的问题不是网络是否精确无标度,而是尾巴是否沉重。他说:“我认为社区对此表示同意。”

但是纽约市微软研究院的网络科学家邓肯·沃茨在推特上表示反对,这种观点“实际上正在改变目标职位”。他说,与“无标度”一样,“重尾”一词在文献中以几种不同的方式使用,并且有时会将这两个词混为一谈,从而难以评估各种主张和证据。他说,“重尾”版本对于许多财产来说,足够接近“无标度”以进行转移,这并不是一个特别广泛的网络类别。

瓦茨说,“无标度实际上确实意味着非常清晰的一次,几乎可以肯定的是,该定义并不适用于很多事情。”他说,但与其说网络科学家回撤并撤回了早期的主张,不如说是一种缓慢的变体,以符合所有证据,同时仍保持其品牌标签令人惊讶的因素。这对科学不利。”

波特喜欢开玩笑说,如果人们想讨论有争议的事情,就应该搁置美国政治并谈论权力法。但是,他说,这些讨论充满争议是有充分理由的。 “我们有这些论点,因为这些问题既困难又有趣。”

Clauset将与Broido的合作视为攻击,而不是呼吁网络科学家采取行动,以检查比他们以往更加多样化的可能机制和学位分布。他说:“也许我们应该考虑新的想法,而不是试图迫使旧的想法适应。”

Vespignani同意有工作要做。他说:“如果你问我,‘你们都同意这个领域的真理是什么?’嗯,还没有真理。” “没有网络的一般理论。”