担忧的传染:焦虑如何传播的博弈论

2020-06-04 02:23:52

这是焦虑算法系列的第三篇文章。单击此处阅读第1部分和第2部分。

当我运营Hipmunk时,我注意到事件对我的影响有一种模式。当事情进展顺利,有好事发生的时候,我感觉很好。但当坏消息发生时,比如我们的销售额达不到预期(或一夜睡不好觉),好消息似乎就没那么好了。

随着时间的推移,我逐渐认识到这是在我脑海中运行的几个算法的结果。然后我注意到这些算法解释了其他一些怪癖,比如:

为什么当我压力很大的时候我会花这么多时间在脑海里。

我将首先介绍这些算法,并展示它们是如何回答这些问题的。然后,我将展示我是如何应用这个框架来减少焦虑的,以及您可以如何做到这一点。

想象一下,你在给一个自主机器人重新编程。你想最大限度地提高它的生存几率,但机器人只知道它遇到的任何事情都有可能是危险的。

忽视真正的威胁要比无意中攻击非威胁的风险大得多。因此,机器人应该攻击哪怕是很小的危险可能性的东西。我把这个阈值概率称为偏执狂线,并这样举例说明:

有了这条偏执线,机器人可以攻击任何有9%的危险几率的东西,总体上存活的几率为95.4%[1]。如果人都是这样设计的,难怪我们会为这么多小事而激动。

当危险的几率发生变化时,事情会变得更加复杂。也许正常情况下,机器人被解雇的可能性很低,但如果股市崩盘,裁员风险就会上升,它应该开始担心。

因此,不同的环境具有不同的威胁分布。这反过来又改变了机器人应该攻击的频率:

任何机器人都不能确切地知道某事有多危险,但彼此之间的经验仍然是有意义的。“除了雷雨,这把电锯似乎比我见过的任何东西都可怕,”机器人可能会想,即使它不知道它是99.3%还是99.7%危险。

让我们将关注区定义为机器人认为足够危险而值得担心的任何东西。然后,它可以在生活和学习过程中调整其关注区:

如果决策造成损害,请适当扩大或缩小关注区,以降低重复错误的风险[2]。

此算法适用于更复杂的情况,例如机器人的感知不准确[4]或环境随时间变化[5]:

“关注区”变得越来越大,也越来越小,因为当真正的威胁从裂缝中溜走时,就表明环境可能突然变得更加危险[6]。我将折射率定义为关注区增长和缩小的比率。通过模拟,我发现15的反应率可以保证95%的存活率[7]--几乎和完美偏执狂系列的95.4%一样好。

这有助于解释为什么人们兴奋起来的速度比我们平静下来的速度快得多:如果我们不这样做,我们活下来的次数就会减少。您可以在这里使用模拟代码。

机器人的注意力决定了它经历了哪些刺激,但它应该如何投入有限的注意力[8]?理想的情况是,在“注意力组合”中保持其一生的安全-将对当前危险的警惕与对学习和成长的渴望结合在一起。

这种风险和增长的平衡反映了一种被称为现代投资组合理论的金融概念。对于给定的增长水平,您可以通过将多个投资与不同的、不相关的风险相结合来最小化风险[9]。

值得庆幸的是,机器人有三个不同的地方可以获得输入,每个地方都有不同的风险和回报:

机器人的直接经验。经验准确地反映了机器人环境的安全或危险程度,因为它们是直接从机器人环境中提取的。但是,如果机器人仅仅依靠自己的经验,它可能会天真地做一些看似安全但其他人知道实际上是致命的新事情(比如将自己插入错误电压的墙上充电器)。

机器人想象的场景。想象力可以帮助推断机器人应该准备应对哪些危险。但是,如果机器人花费太多时间根据过去的经验进行想象,它就有可能强化一个过时的关注区。

其他机器人谈过的经验[10]。倾听他人的意见可以提高人们对新危险的认识,但听得太多可能会产生错觉。法西斯主义的机器人政治家可能会煽动偏执;欺诈性的机器人CEO可能会在其他人发现欺诈之前煽动自满抛售股票[11]。

因此,你的机器人应该将注意力集中在这三个方面,并将其注意力重新分配给每个变化的风险和回报。

每个人都有一把手枪,每个人都有一把.45口径的手枪,而且至少在我看来,当其他人放弃他们的手枪时,我会放弃我的吉尔·斯科特-海伦的哲学。

人类不是机器人,但如果你想象我们的大脑“运行这些算法”,有些事情就变得更容易理解了。

当世界看起来安全时,它会以低风险提供巨大的利益。但是,当世界看起来很危险的时候,注意力组合表明思考比探索更安全[12]。我注意到,当我压力很大时,我往往会陷入思维循环,而不是冒险做出艰难的决定[13]。

我们的注意力部分集中在别人的言行上。例如,当人们逃离火灾时,路人本能地知道他们也应该远离[14]。

这是反身性的一个例子,其中因果循环回到自身[15],它被很高的反应率放大了。

社会充满了传染性的担忧:银行挤兑、股市崩盘、不断升级的关系冲突和报复性暴力。每当我怀恨在心的时候,我就会注意到这一点。

一旦失去信任,重建就需要更长的时间,因为高的反应率会让我们迟迟不能接受世界变得更安全了[16]。

适当程度的关注可以提高存活率,但适当的关注度要视情况而定。来自安全环境的人如果不那么担心,他们会过得更好,但来自危险环境的人,如果他们非常担心,他们更有可能存活(和繁殖),就像我下面展示的那样。经过几代人的反复,这种选择会导致显著的基因变异,事实上,人们天生就有不同的焦虑倾向。

它不仅存在于我们的基因中。研究表明,由于父母的表观遗传改变(决定哪些基因表达的改变),大屠杀幸存者的孩子经历了更多的终生心理压力[17]。这项研究还处于萌芽阶段,但如果直接从父母的身体中获得一个适当的关注区,将会提供一个真正的生存优势。

人们也从生活经历中内化了适当的关注区。被忽视或被殴打的儿童在以后的生活中患焦虑症的风险要高得多;面临持续数月威胁的士兵患创伤后应激障碍的风险要高得多。创伤经历就像是一次大剂量的破坏性投入,将关注区推到了最高的极端[18]。

为了证明这一点,设想每个人都有一个不同的关注区,这个关注区在一生中是固定的和不变的。但是假设它们都可以选择自己的环境来最大化生存。这里有四种排列:

低关注度的人(顶排)在安全环境中生存的几率(94%)高于在危险环境中生存的几率(93%)。

然而,高度关注(低排)的人在危险环境中存活的几率(97%)比在安全环境中存活的几率(93%)更高。

在现实生活中,由于我们的基因和生活经历,我们对我们的关注区有一定的控制力,但不是完全的控制力。虽然你可能会注意到这种趋势,甚至故意降低你的关注区(就像我下面概述的那样),但大多数人不会注意到这一点。

结果是:我们倾向于选择我们的工作和人际关系来反映我们熟悉的压力水平。我知道,如果我没有适应高中和大学的高压力,我不会觉得经营企业的压力是可以忍受的。

我看到了太阳,它今天更亮了,因为我决定找到内心的平静,隐姓埋名地重新整理我的思想。

值得庆幸的是,这些算法还提供了减少焦虑的技术。关注区根据你体验“遭受伤害”和“毫发无损”的频率而变化,你可以通过不同的方式引导注意力来改变平衡。

虽然我们默认使用压力很大的环境,但是可以覆盖默认设置。

例如,当我发现自己在工作中不堪重负时,我开始在日程表上安排半个小时的休息时间,这样我就不会以20天的背靠背会议而告终。在工作之外,我不再把时间花在一些感觉没有方向盘的非营利组织上,而是把更多的时间投入到锻炼和学习新的爱好上。

总的来说,我很高兴互联网的存在。但我怀疑,总有一天我们会用回首可口可乐含有可卡因的方式来看待今天的互联网。

新闻是信息量大的,但主题是无情的负面偏见[20]。许多社交服务都会计分(比如Instagram点赞、约会应用配对),这就产生了一种微妙的压力,要求他们花更多的时间[21]。由于缺点,我避免每天检查这类服务超过一次[22]。

相比之下,阅读大创意和加入某些在线社区提供了巨大的积极投入。我喜欢花时间在与我共事的WhatsApp创始人小组中;对一些人来说,Reddit支持小组也有类似的目的。

当我经营Hipmunk的时候,有一些压力很大的时候,改变我的环境或切断联系是没有选择的。积极的最佳来源是与其他能产生共鸣的人交谈。

支持性的人可以包括朋友、恋人、亲戚、同龄人、导师、支持团体、治疗师和教练。(在最极端的情况下,还有国家自杀预防热线。)。

积极情绪和担忧一样会传染,但需要更多的积极情绪才能将关注区移动到同等程度。因此,当我感到压力时,我会更频繁地进行支持性的签到。

你也可以定期给自己鼓励和理解。这就是自我同情背后的理念。起初,我觉得这听起来有点俗气,但有时浓郁的奶酪才是搭配苦味指甲的最佳选择。

因为焦虑让人感觉不好,所以面对它时带着恐惧、判断和鄙视等负面情绪是很自然的。我降低了我的关注区,取而代之的是用中性的输入来应对焦虑,比如深呼吸,或者积极的输入,比如感恩(感谢焦虑试图保证我的安全)。

我们收到的许多负面信息来自我们想象的可怕的未来,但并没有规定你必须将可怕的想法处理成可以被负面解读的东西。另一种解释是中性的:思想是在你脑海中运行的随机算法的输出。

使用这种方法就像在带有断点的调试模式下运行心智代码,这是我通过正念练习改进的东西[23]。

或者,当一部恐怖电影开始在你脑海中播放时,你可以注意到这一点,并选择将注意力重新引导到中性或积极的想法上。这需要“自我思想控制”(也就是焦点),遗憾的是,我们的默认操作系统没有预装这一点。

我试着用冥想来建立注意力,但一开始并不顺利。无法集中注意力的感觉就像冥想测试不及格。我对冥想的新态度是“试着集中注意力”,同时对挑战有更多的欣赏。我的注意力得到了改善,现在我经常在片头字幕中打断不愉快的想法。

经营Hipmunk时,我最担心的不是失败,而是无限的不确定性。我担心一年后我还是不知道事情会不会好起来。简而言之,我很担心我会继续焦虑。

从那以后,我明白了焦虑是一种体面的生存方式,但却是一种可怕的生活方式。

所以我升级了我的智力软件。起初,这让我感到不舒服和陌生,因为我的担忧没有调整。但随着时间的推移和实践,我的内心意识到我的环境实际上变得更安全了,我的担忧也重新调整了下来。

当我想象很多未来,并且相信其中大多数都很可怕时,我很焦虑。当我保持想象力,抛弃恐惧时,我是有创造力的。我的工作变得更好了,我的心情也变得更好了。

在多年的怀疑和压力之后,我改变了主意。升级智力软件需要付出努力,但这是值得的。

感谢我的预读者们的有益评论:安德鲁·万斯利、布莱恩·克里斯蒂安、詹姆斯·萨默斯、凯特·迈耶、克里斯托弗·索普、丹妮尔·斯特拉赫曼、凯利·皮勒、南希·华、雪莉·王、史蒂夫·赫夫曼、泰勒·贝克、乌里·洛帕丁和扎克·斯通。感谢尤瓦尔·哈克的插图。

在这里概述的某些假设下,这是它所能希望的最好的生存概率。↩︎。

这种迭代猜测未知量的方法是卡尔曼滤波的核心。我在这里描述的算法类似于用于猜测环境威胁级别的卡尔曼滤波器。然而,我选择牺牲卡尔曼滤波器的(一点点)精确度,以换取一个简单得多的算法,它的参数与人类的经验有更明显的相似之处。↩︎。

对于此动画,我将正态分布的随机噪声添加到实际威胁级别(将总和限制为最小0%和最大100%,这样它就不会脱离图表),这是黑色和白色三角形之间的区别。↩︎。

例如:风险评估系统可能根据错误或陈旧的数据进行训练,它可能对经常遇到的输入是准确的,但对于很少遇到的输入可能是不准确的,它的代码中可能存在错误,或者风险评估系统(例如硬件传感器)的输入可能是有偏差的。↩︎

不管环境如何变化,最佳偏执线都保持不变,这与直觉不符,但却是真的。回想一下,偏执线处理的是绝对威胁可能性,而关注区处理的是相对威胁可能性。每次机器人面临新的情况,它的生存几率都是由这里的收益矩阵决定的。假设它遇到了80%可能是安全的东西。如果它没有攻击,它有80%的机会是正确的(在这种情况下,它总是活下来),有20%的机会是错误的(在这种情况下,它会死亡),导致总的存活几率为80%。相比之下,如果它攻击,它有20%的机会是正确的(在这种情况下,它总是存活下来)和80%的机会是错误的(在这种情况下,它在90%的时间里存活),总的存活可能性为20%+80%*90%=92%。因此,它应该在遇到80%可能是安全的东西时进行攻击-无论这些遭遇是经常发生(如在安全环境中)还是不经常发生(如在危险环境中)。同样的原理也适用于任何给定的威胁可能性,这就是为什么最优偏执线只取决于收益矩阵,而不取决于威胁的分布。↩︎。

这是克劳德·香农(Claude Shannon)定义的“信息量大”,意思是“令人惊讶”。虽然这有助于解释为什么大的折射率在一般情况下是有意义的,但它到底应该多大取决于多个参数。例如,如果您选择的初始关注区太低,机器人将需要更高的反应率进行补偿,以便它能快速将关注区增加到最佳级别。如果机器人的生命是肮脏和野蛮的(反映在一个危险扭曲的环境中)和短暂的(根据它在生命中遇到的事情的数量很少来衡量),太低的初始关注区需要超高的反应性比率来补偿。↩︎。

如果根据经验找到这个数字会让您感到不快,请务必计算出封闭形式的解决方案并将其通过电子邮件发送给我;我将更新此脚注以链接到您的解决方案。这里是一个起点:假设关注区缩小了x,扩展了xr(其中R是反应率),z%的时间发生增长,w%的时间发生收缩。z等于机器人遇到假阴性的时间百分比(在上一篇文章中,在具有91%的偏执线的均匀威胁分布中大约是0.4%),而w等于机器人遇到假阳性的时间百分比(大约4.1%)。一旦机器人“找到”偏执线,我们希望它停留在那里,这意味着从那里向右和向左的预期运动应该相等:xw=xrz,因此R=w/z,或10。然而,这个解决方案只对x的无穷小值(以便它保持在偏执线附近)、无限迭代(这样基本上对于所有迭代机器人都已经“找到”了偏执线)和统一的静态威胁分布有效。否则解决方案会更加复杂。↩︎。

我们倾向于考虑“花费”时间,但因为我们遇到的每一件事都会触动我们的关注区,我们关于时间的决定也是一种“投资”,它塑造了我们对环境安全程度的看法。↩︎。

这一点很重要,因为任何机器人都不能仅仅依靠自己的经验和想象力(后者也是它的经验的函数)来知道它是否从根本上偏离了危险的基础。其他机器人充当有关世界上刺激物威胁程度的分布式数据存储库。↩︎。

或者,另一个机器人可能只是在一个非常不同的环境中体验生活,并尽其所能分享这种经历(“我们在雪地里走了10英里去上学,双向上坡”)。↩︎。

我的朋友分享了一个关于这件事的第一手例子:“你开始思考你的男朋友是不是早些时候在你家给你做早餐的时候没关炉子,很快你就会因为你的整个房子可能被烧毁而吓坏了,所以你打电话给他,他说他肯定没有开着炉子-尽管他可以肯定,因为没有人看着自己做这样的事情,而且我们都是例行公事,以至于个人的记忆都变得模糊了。”他说,“你可以肯定,他没有开着炉子,因为没有人看着自己做这样的事情,而我们都是如此例行公事地做饭,以至于个人的记忆都变得模糊了。”这个答案只会让你觉得你不能信任你的伴侣,也许你应该和他分手,但如果你这样做了,你不会孤单吗?如果你没有遇到其他容忍你神经质的人,你可能会永远孤单。如果你要去的这周的冥想静修让人无法忍受,恰恰是因为你正处于一种疯狂焦虑的不确定状态,那该怎么办?“↩︎。

反身性甚至可以在个人内部产生。如果一个机器人找了两个月的工作都找不到,它可能会想象再也不会被雇佣了。这个可怕的想法增加了机器人的关注区,这使得它在大脑中花费更多的时间,而不是冒着进一步死亡的风险

事实上,知道环境已经变得危险对我们的生存来说是如此宝贵,以至于我们即使从非语言的线索上也能迅速地察觉到这一点。↩︎。

所有这些后果都可能对人类不利,但进化也会在个体层面上发挥作用。当利益集中到你身上,而伤害分散到其他每个人身上--其他每个人都在自私地行事--你应该试着在其他人之前从银行提取现金,这是有意义的。↩︎。

不那么戏剧性的压力扩大了关注区,但效果不那么戏剧性-尽管许多小压力的累积可能会产生类似于一个中等压力的影响。↩︎。

事实上,还有更多的基因。

..