蜜蜂摇摆舞的空间信息内容

2020-12-21 16:18:22

1英国萨塞克斯大学生命科学学院,养蜂学和社会昆虫实验室

1954年,Haldane和Spurway发表了一篇论文,他们讨论了关于蜜蜂摇摆舞的信息内容,其中涉及了最近开发了形式信息理论的Norbert Wiener的思想。通过使用最近对舞蹈准确性进行研究的经验数据,重新分析了摇摆舞的两个向量分量(方向,距离)中的信息内容,从而回到了这一概念。我们的结果表明,方向分量传达了2.9位信息,而距离分量传达了4.5位信息,这在一定程度上与基于von Frisch收集的数据的Haldane和Spurway的估计相符。当然,与在足够的时间内可以通过人类语言传达的信息相比,或者与通过互联网常规传输的信息相比,这些信息是少量的。但是,少量信息如果是正确的信息则可能非常有价值。该信息的接收者,即巢蜂,知道如何自适应地做出反应,以使信息的价值不会因其信息含量低而被否定。

1954年,Haldane和Spurway(1954)在科学杂志Insectes Sociaux上发表了一篇论文,标题为“蜜蜂的交流的统计分析以及与其他动物的交流的比较”。 Haldane和Spurway(1954)使用卡尔·冯·弗里施(Karl von Frisch)的数据集,至少通过舞蜂传达的方向,使用信息论方法研究了摇摆舞的传播方式(冯·弗里施,1946,1967)。当然,冯·弗里施(von Frisch)的主要目标是理解舞蹈语言,而不是获得精确的定标来研究蜜蜂觅食的地方:他选择只与优秀的舞者合作(Chittka and Dornhaus,1999)。会系统地低估舞蹈中的错误(Schürch和Couvillon,2013;Schürch等人,2013),因此会对数据产生偏差。

自原始论文以来,已经过去了许多年,我们对蜜蜂的舞蹈所表现的含义和表现有更好的理解(Couvillon,2012; Couvillon等,2012;Schürch等,2013)。因此,我们有兴趣通过使用Schürch等人的校准数据来分析Haldane和Spurway(1954)提出的思想和理论。 (2013)。

在这里,我们首先介绍信息理论的组成部分,这些组成部分是了解具有连续结果的事件的信息内容所必需的,例如觅食距离和方向。然后,我们将如此提出的理论应用于我们先前的校准实验中的数据(Schürch等,2013)。我们的估计应能更准确地描述舞蹈的信息内容,因此将对摇摆舞交流的发展进行研究。

当蜜蜂进行摇摆舞时,她会将闲置资源的信息传送给她闲置的巢友,例如食物或她去过的新巢穴(von Frisch,1946,1967)。在信息论中,信息被定义为减少不确定性(Shannon,1948)。因此,从信息论的角度来看,跳舞的蜜蜂会减少其追随者的不确定性,即舞者在哪里收集食物或在哪里找到合适的巢穴。信息理论为我们提供了一种量化初始不确定性和舞蹈发生后剩余不确定性的方法,因此可以对信息进行量化。

信息理论中的不确定性通常称为熵,通常用符号H表示(Shannon,1948; Norwich,1994)。如果我们首先考虑具有x个离散结果的随机事件,并且第i个可能结果的概率为p i,则H定义为

例如,在摇摆舞的情况下,结果可能代表蜜蜂在数百米内觅食的距离,也就是说,我们观察返回的觅食者在0–100(i = 1),100–200范围内觅食的概率(i = 2),200–300(i = 3),…米和pi是指觅食者在第i个间隔中觅食的概率。换句话说,不确定性H是结果概率的加权对数之和(Norwich,1994)。在H的计算中选择对数的底是任意的。在计算机科学中,选择基于基数2,因为它反映了电子开关的开/关状态,并且H的单位是熟悉的位。根据Norwich(1994),我们在这里使用基本单位e和自然单位,但随后将计算结果转换为位:

如果信息是熵的减少,则当H由于我们观察到离散的x结果之一而完全减少时,则信息表示为=H。

在我们以数百米为单位测量的蜜蜂觅食距离的示例中,我们将确切地知道蜜蜂是在200至300 m还是300至400 m之间觅食的。当然,干扰可能会阻止舞蹈追随者准确地确定反映觅食距离的摇摆步的持续时间,或者跳舞蜜蜂的跳舞精度可能受到限制(Tanner和Visscher,2010; Couvillon等)等人,2012; Preece和Beekman,2014)。对于舞蹈追随者或对于人类观察者而言,可能会残留一些不确定性,因此,在我们观察到蜜蜂舞蹈之后,蜜蜂觅食的可能间隔数大于1,并且< H(图1)。

图1.舞蹈信息作为舞蹈不确定性的降低。 (A)如果我们知道蜜蜂在0到3 km之间觅食,但不在哪里觅食,则我们的先验知识将概率归因于蜜蜂探访30×100 m仓(浅灰色仓)中的任何一个的可能性。知道了舞蹈如何转换为距离后,观察舞蹈后,我们的不确定性就会减少到估计距离μ周围的较窄区域,该距离取决于标准偏差σ(深灰色区域)。我们先前的不确定性与观察舞蹈后仍然存在的不确定性之间的差异是舞蹈传达的信息。不确定性(熵H)取决于分箱的大小,但是信息却没有。在(B)中,已经选择了较小的分箱,并且与(A)相比,熵增加了,但是除了测量更准确之外,该信息没有改变。

诺里奇(Norwich(1994))给出了一个有关在嘈杂的频道(例如无线电)上进行语言传输的示例。我们被要求考虑10个可能相等地被传输的数字,以使熵等于log10。“ 5”和“ 9”这两个口语可以混淆。因此,即使在听到语音数字之后,在发送者端说出“ 5”还是“ 9”仍可能存在一些不确定性。如果在传输之后,将“ 5”与“ 9”相混淆的可能性相等,反之亦然,则熵已从log 10减小到log 2,但没有减小到log 1 =0。在这种情况下,信息由听到单词之前的不确定性减去听到单词之后剩余的不确定性,即

根据熵的定义,还可以得出信息取决于先验概率p i的值的集合。如果我们观察到经过训练的已知蜜蜂以已知距离跳动的标记蜜蜂的舞步,我们将无法通过观察摇摆的持续时间来获得有关觅食距离的信息。收到的信息不是绝对数量(Norwich,1994)。

关于摇摆舞的交流,我们现在只需要考虑一件事。觅食的距离和方向分量不是离散地传达,而是连续不断地传递。让我们假设概率密度函数p(x)代表蜜蜂在距离x处觅食的概率。设x以米为单位,Δx是连续觅食距离的离散分区之间的恒定长度。然后,p(x)Δx = p(500)(1)是从种群中随机选择的返回觅食者的觅食距离被发现在500至500 + 1 m之间觅食的概率的合理近似值。我们还可以根据需要选择一个合适的上限; 14 km是蜜蜂在文献中报道的最大觅食距离,似乎是一个合理的选择(Eckert,1933)。我们可以将概率密度函数分解为Δx = 1 m的多个窄矩形,并计算熵H:

Warning: Can only detect less than 5000 characters

对于H之后,我们必须离散化连续正态分布并计算每一步i的概率密度

H after = − ∑ i = 1 14,000 1 14,000 1 2πσ2 e −(i −μ)2 2σ2 log log 1 14,000 1 2((2) σ2(6)

其中,μ是均值,σ是正态分布的标准偏差。可以使用我们的校准曲线从观察到的舞蹈中估计这两个参数(Schürch等,2013; Couvillon等,2014a,b)。简而言之,在Couvillon等人中,获得觅食距离的概率分布。 (2014b)和Couvillon等。 (2014a),我们使用了基于Gibbs采样的线性校准模型(如Schürch等人所述(2013年,用于校准的R和jags脚本作为补充材料提供))。然后从该模型的后验样本(每支舞蹈N = 1000)中,计算给定舞蹈的平均值和标准差。表1列出了Couvillon等人的10支舞蹈中的这些参数。 (2014a)随机选择。请注意,为了计算之后的H,我们使用了100个随机选择的舞蹈来计算平均值μ= 1716.011 m和平均值σ= 147.246 m。然后,我们使用计算机程序(请参阅补充材料)计算H并随后计算H。如果我们这样做,我们得到

至于距离,我们计算方向分量的信息。之前计算H再次简单明了。步数将取决于我们如何划分圆。例如,如果将圆分成16个切片,则步长将为π/ 8。通过反复试验,我们发现π/ 512的步长足以准确测量信息内容。 H之前就是

在使用与距离情况相同的方法进行H的计算时,用冯·米塞斯分布的概率密度函数代替正态概率密度函数:

H after = − ∑ i = 1 1024 1 1024·eκcos(i −μ)2πI 0(κ)log 11024·eκcos(i −μ)2πI 0(κ)(10 )

其中,μ是平均方向,κ是浓度参数,I 0是阶数为0的修正贝塞尔函数。我们在R中使用了圆形包装来计算这些概率密度(请参阅补充材料)。我们发现对于μ= 0和κ= 24.9(Schürchet al。,2013),熵为

我们最近将舞蹈映射为概率云而不是单个点的方法的好处(Schürch等人,2013; Couvillon等人,2014a; Garbuzov等人,2014)现在也将我们用于第一个时间来直接计算组合的空间信息(请参见图2)。我们可以在网格上覆盖有限的景观,并基于Couvillon等人使用的模拟舞蹈。 (2014a),我们可以计算网格中每个正方形被访问的概率。如果每个舞蹈都由许多模拟代表,则该舞蹈访问网格正方形的概率为落入该正方形的模拟舞蹈的数目除以模拟舞蹈的总数。

图2.如果在有限的景观上放置一个网格,我们可以为每个网格平方计算跳舞指向它的概率。在(A)中,我们看到了先验概率,它假设14 km半径内每个正方形的概率相同。在(B,C)中,我们描述了分别观察到1750和875 m网格正方形长度的舞后的概率。这对应于图3中的第3次和第4次迭代。

我们可以再次使用已经访问过每个正方形的统一先验期望,也就是说,我们对已经访问过任何正方形的概率的先验期望对于所有正方形都是相等的。我们可以计算之前的H和之后的H​​,然后得到的信息就是不确定性的降低。电子补充材料提供了R脚本,可以在更精细的网格上计算信息。我们的数值计算表明,对于我们先前在14 km半径内均等概率的假设,并且随着我们选择越来越精细的网格正方形,舞蹈的信息内容接近7.3位(图3)。

图3.(A)随着迭代次数的增加,因此(B)网格中正方形的大小减小,通过观察舞蹈获得的信息接近7.3位。

请注意,为了计算网格上的信息,我们现在还受到根据校准曲线预测的模拟舞动次数的限制,我们在此处选择的最小网格大小约为110 m。如果我们选择较小的网格大小来进行每舞蹈1000次仿真,则概率格局将变得不连续。更具体地说,即使访问了整个区域的可能性很高,某些网格广场也不会在其上进行模拟舞蹈。在那种情况下,我们的离散计算不再反映真实的不确定性。

在这里,我们已经展示了如何使用先前发布的摇摆舞校准和摇摆舞数据来计算

......