我的新书“如何让世界变得美好”(How To Make The World Add Up)今天在英国和世界各地(美国/加拿大除外)出版。
今年会不会又是1954年的一年呢?原谅我,我痴迷于1954年,不是因为它提供了另一个大流行(那是1957年)或经济灾难(1953年美国出现温和衰退)的例子,而是因为更狭隘的原因。1954年,统计界出现了两种截然不同的愿景--塑造了我们的政治、媒体和健康的两种愿景。今年我们面临着类似的选择。
其中第一个观点出现在美国记者达雷尔·赫夫(Darrell Huff)的书“如何利用统计数据”(How To Live With Statistics)中。轻快、聪明、机智,是数字交流的一个小小奇迹。这本书当时好评如潮,多年来受到许多统计学家的好评,据说是有史以来出版的关于这一主题的畅销书。这也是一种蔑视:读了它,你可能再也不愿意相信基于数字的说法了。
今天的怀疑是有充分理由的。去年出版的“统计的艺术”(The Art Of Statistics)一书的作者戴维·斯皮格哈尔特(David Spiegelhalter)哀叹,英国政府的一些冠状病毒图表和测试目标是“数字戏剧”,把数字部署成“可怕的、可怕的”政治表演。
斯皮格尔哈特说:“当统计数据处于旋转医生的控制之下时,它们的完整性和可信性会受到极大的损害。”他是对的。但我们这些极客必须小心--因为损害也可能来自我们自己。
对于赫夫和他的追随者来说,学习统计学的原因是为了抓住说谎者的把戏。正如我们将看到的,这种怀疑的心态把赫夫带到了一个非常令人不快的境地。一旦人们开始愤世嫉俗,就很难想象统计数据能起到有用的作用。
但他们可以--早在1954年,英国流行病学家理查德·多尔(Richard Doll)和奥斯汀·布拉德福德·希尔(Austin Bradford Hill)发表的一篇学术论文中就体现了另一种观点。他们收集了第一批令人信服的证据,证明吸烟会极大地增加患肺癌的风险。他们收集的数据说服了这两个人戒烟,并通过促使其他人也这样做来帮助拯救了数千万人的生命。这不是统计上的把戏,而是对公共卫生的贡献,几乎不可能夸大。
我希望你能理解我对这两种截然不同的统计数据的痴迷:一种是把戏,一种是工具。多尔和希尔不辞辛劳的做法照亮了世界,拯救了交易中的生命。赫夫的选择看起来很聪明,但却是一条容易走的路:诱人的、上瘾的和腐蚀性的。怀疑有它的位置,但很容易凝结成愤世嫉俗,并可能被武器化成比这更有害的东西。
这两种世界观很快就开始发生冲突。赫夫的“如何利用统计学”似乎完美地说明了为什么普通人、诚实的人不应该过多地关注狡猾的专家和他们可疑的数据。这样的想法很快就被烟草行业采纳,其黑暗而聪明的策略是在多尔和希尔提供的证据面前制造怀疑。
正如埃里克·康威(Erik Conway)和内奥米·奥雷斯克斯(Naomi Oreskes)的“疑惑商人”(Merchants Of Suspect)等书中所描述的那样,这个行业完善了传播不确定性的策略:呼吁进行更多研究,强调怀疑和避免采取激进措施的必要性,突显专家之间的分歧,并为其他调查路线提供资金。同样的策略,有时甚至是同样的人员,后来都被用来质疑气候科学。这些策略之所以有效,部分原因是它们呼应了科学的理想。这距离英国皇家学会的座右铭“verba中的nullius”(相信任何人的话)只有一小步,也离“无人知晓”的腐蚀性虚无主义只有一步之遥。
那么2020年会是另一个1954年吗?从统计数据上看,我们似乎站在了另一个岔路口。虚假信息仍然存在,因为公众对新冠肺炎的理解已经被阴谋论者、巨魔和政府的舆论医生弄得模糊不清。然而,信息也在那里。收集和严格分析数据的价值从未像现在这样明显。面对年初的一个完全神秘的局面,统计学家、科学家和流行病学家一直在创造奇迹。我希望我们选择正确的分叉,因为如果我们愿意学习,大流行可以给我们上统计学的课,反之亦然。
Spiegelhalter说:“这场大流行给我上了一堂课,那就是统计数据的重要性令人难以置信。”没有统计信息,我们就没有希望理解面对一种新的、神秘的、看不见的、快速传播的病毒意味着什么。曾几何时,我们会用手托着鼻子祈祷自己能幸免于难;现在,在我们希望医学进步的同时,我们也可以冷静地评估风险。
例如,如果没有好的数据,我们不会知道这种感染对90岁的人来说是9岁的1万倍-尽管我们读到年轻人死亡的可能性远远高于老年人,仅仅因为这些死亡是令人惊讶的。需要从统计学的角度来明确谁有风险,谁没有风险。
好的统计数据也可以告诉我们病毒的流行情况,并确定进一步活动的热点。赫夫可能曾将统计学视为说服黑魔法的载体,但当谈到理解一种流行病时,它们是我们拥有的为数不多的工具之一。
但是,虽然我们可以使用统计数据来计算风险并强调危险,但我们很容易就会问“这些数字是从哪里来的?”我指的不是现在标准的引用消息来源的要求,我是指数据的更深层次来源。
尽管赫夫有很多缺点,但他并没有不问这个问题。他重述了一个被称为“印花税定律”(Stamp‘s Law)的警示故事,这个故事以经济学家约西亚·斯坦普(Josiah Stamp)的名字闻名。他警告称,无论一个政府多么喜欢收集统计数据,“把它们提高到n次方,拔掉立方根,准备美妙的图表”,人们很容易忘记,潜在的数字总是来自地方官员,“他只会写下他该死的喜欢的东西”。
愤世嫉俗是显而易见的,但这里也有洞察力。统计数据不是简单地从互联网数据库下载或从科学报告中粘贴的。归根结底,他们来自某个地方:有人计算或测量了一些东西,理想情况下是系统地、小心翼翼地。这些系统计数和测量的努力需要资金和专业知识-不能想当然地认为它们是理所当然的。
在我的新书“如何让世界加起来”(How To Make The World Add Up)中,我介绍了“统计基础”的概念--人口普查和国民收入账户等数据来源是官方统计学家辛勤收集和分析数据的结果,他们的痛苦得不到多少感谢,而且经常成为威胁、诽谤或迫害的目标。
例如,在阿根廷,长期任职的统计学家Graciela Bevacqua被要求对通胀数据进行“四舍五入”,然后在2007年因为得出的数字太高而被降级。她后来因虚假广告被罚款25万美元-她的罪行是帮助制作了一份独立的通胀估计。
2011年,安德烈亚斯·格奥尔基奥(Andreas Georgiou)被请来领导希腊统计机构,当时希腊统计机构被认为与该国的巨型木马一样值得信赖。当他开始编制国际观察家最终认为可信的希腊赤字估计值时,他被指控犯有“罪行”,并面临终身监禁的威胁。诚实的统计学家比我们所知道的更勇敢,更有价值。
在英国,我们不会习惯性地威胁我们的统计学家--但我们确实低估了他们。
“国家统计局正在做非常有价值的工作,坦率地说,没有人注意到这些工作,”Spiegelhalter说,并指出每周的死亡数字就是一个例子。“现在我们对此深表赞赏。”
的确如此。这块统计基础是必不可少的,当它丢失时,我们会发现自己陷入了混乱的泥潭。
我们对世界的统计理解的基础往往是在应对危机时收集起来的。例如,现在我们认为有“失业率”是理所当然的,但在一百年前,没有人能告诉你有多少人在找工作。严重的经济衰退使这个问题具有政治意义,因此各国政府开始收集数据。最近,金融危机来袭。我们发现,我们关于银行系统的数据参差不齐,速度很慢,监管机构采取了措施加以改善。
SARS-CoV-2病毒也是如此。起初,我们只有几个来自武汉的数据点,显示出令人震惊的15%的高死亡率-41例中有6人死亡。流行病学家很快开始整理数据,试图确定确诊病例大多是重症监护患者这一事实,有多么夸大了病死率。
奇特的环境-例如钻石公主号游轮,几乎每个人都接受了测试-提供了更多的洞察力。美国约翰·霍普金斯大学推出了一个数据资源仪表盘,“大西洋月刊”发起的Covid Tracking Project也是如此。通过这些数据的力量,一个难以捉摸的神秘威胁变得清晰可见。但这并不是说一切都很好。
“自然”杂志(Nature)最近报道了美国的“冠状病毒数据危机”,其中“政治干预、组织混乱和多年来忽视公共卫生数据管理意味着这个国家正在盲目飞行”。美国也不是唯一的国家。西班牙在6月初简单地停止了对Covid死亡人数的报道,使其数据无法使用。虽然英国现在拥有令人印象深刻的病毒检测能力,但在疫情爆发的关键最初几周,加速这一进程的速度极其缓慢。部长们一再使用误导性的定义来欺骗公众正在进行的测试的数量。在封锁期间的几周里,政府无法说出每天有多少人接受测试。
从那时起,已经取得了巨大的进步。英国国家统计局(Office For National Statistics)在危机期间的灵活性令人印象深刻,例如,在组织对具有代表性的人口样本进行每周系统测试方面。这使我们能够估计病毒的真实流行情况。几个国家,特别是东亚国家,提供了关于最近感染的可访问的、可用的数据,使人们能够避开热点地区。
这些事情不是偶然发生的:它们需要我们投资于基础设施,以收集和分析数据。根据这场大流行的证据,在美国、英国和许多其他地方,这种投资早就应该进行了。
乔纳斯·奥洛夫松(Jonas Olofsson)是一位研究嗅觉的心理学家,他曾给我讲过该领域的一个经典实验。研究人员让受试者闻到一股气味,并询问他们对此的反应。在某些情况下,实验对象被告知:“这是美味奶酪的香味。”其他人则被告知:“这是腋窝的味道。”事实上,气味是两者兼而有之:一种芳香分子,既存在于流动的奶酪中,也存在于身体的缝隙中。但高兴或厌恶的反应被人们的预期戏剧性地塑造了出来。
人们希望,统计数字应该比含糊的香气提供更客观的世界观。但是,虽然可靠的数据为我们提供了我们无法通过其他任何方式获得的洞察力,但数字从来不能说明问题。它们也是由我们的情感、我们的政治,也许最重要的是我们的先入为主的观念塑造的。当统计数据处于派生医生的控制之下时,它们的完整性和可信性会受到极大的损害。
一个引人注目的例子是今年3月23日决定在英国实行禁闭。事后看来,那已经太晚了。“提前一周封锁可能会拯救数千人的生命,”“生与死的数学”(The Maths Of Life And Death)一书的作者基特·耶茨(Kit Yates)表示。如今,颇具影响力的流行病学家尼尔·弗格森(Neil Ferguson)和“独立圣人”(Independent Sage)科学家小组主席大卫·金(David King)也认同这一观点。
逻辑很简单:当时,病例每三到四天就会翻一番。如果封锁早在一周前停止了这一过程,就会防止两起翻番事件,并挽救了第一波疫情中死亡的6.5万人中的四分之三,以额外的死亡人数衡量。
这可能高估了影响,因为人们已经自愿退出社交活动。然而,毫无疑问的是,如果真的发生了封锁,更早的封锁会更有效。而且,耶茨说,由于感染率在封锁前只用了几天就翻了一番,但一旦开始就需要长达数周的时间才能减半,“在封锁的最后阶段花了我们5到8周的时间之前,我们每周都会更早地摆脱封锁。”( . )。
那么,为什么封锁这么晚呢?毫无疑问,这一决定是有政治因素的,但政府的高级科学顾问似乎认为,英国仍然有充足的时间。3月12日,英国首相鲍里斯·约翰逊(Boris Johnson)在政府首席医疗顾问克里斯·惠蒂(Chris Whitty)和首席科学顾问帕特里克·瓦伦斯(Patrick Vallance)的陪同下,举行了首次大型定位式新闻发布会。
意大利刚刚经历了第1000例Covid死亡,Vallance指出,在疫情曲线上,英国比意大利落后大约四周。事后看来,这是错误的:现在已经统计了晚登记的死亡人数,我们知道英国在仅仅11天后的3月23日这一封锁日越过了同样的里程碑,但似乎在3月初,政府并没有意识到自己的时间有多么紧迫。
直到3月16日,约翰逊还宣布,感染人数每五到六天就会翻一番。耶茨说,问题在于,英国的病例和死亡数据表明,情况的发展速度要快得多,每隔三四天就会翻一番-这是一个巨大的差异。到底出了什么问题还不清楚,但我敢打赌,这是一个要么奶酪要么腋窝的问题。一些有影响力的流行病学家已经制作了复杂的模型,根据中国疫情最初几周的数据,五到六天的翻倍时间似乎是最好的估计。
耶茨说,对于政府的科学顾问来说,这些模型似乎很有说服力:“如果说有什么不同的话,那就是它们做得太好了。”耶茨辩称,影响政府关于加倍时间想法的流行病学模型足够详细和令人信服,当零星、模棱两可的英国早期数据与之相矛盾时,很难重新调整。我们都看到了我们期望看到的东西。
在这种情况下,结果是封锁的延迟:这导致了更长的封锁时间,数以千计的本可以预防的死亡,并对人们的生计造成了不必要的额外损害。这些数据是无价的,但是,除非我们能够克服我们自己的认知过滤器,否则这些数据是不够的。
在这场危机中给我印象最深的专家并不是最有名的,也不是最自负的。2月中旬,伦敦国王学院(King‘s College London)的传染病专家纳塔莉·麦克德莫特(Nathalie MacDermott)冷静地揭穿了公众对这种新冠状病毒致命程度的更为耸人听闻的担忧。然后,她同样平静地向我解释说,这种病毒很可能成为一种流行病,除非采取非常措施,否则我们可以预计它将感染世界上一半以上的人口,真正的死亡率尚不确定,但似乎在0.5%至1%之间。事后看来,她在所有重要的事情上都大体上是正确的。
麦克德莫特经过深思熟虑的猜测穿透了复杂建模和数据匮乏的猜测的迷雾。我很好奇她是怎么做到的,所以我问了她。
她说:“那些花了很多时间仔细研究这些数据的人有时很难抽出头来看看周围发生了什么。”“我也相信数据,但有时当我们没有数据时,我们需要环顾四周,解读正在发生的事情.”
麦克德莫特2014年在利比里亚工作,在导致1.1万多人死亡的埃博拉疫情前线工作。当时,国际组织对风险持乐观态度,而地方当局则处于危机之中。当她到达利比里亚时,治疗中心人满为患,病人躺在地板上,从多个区域自由出血,每小时死亡。
这段可怕的经历塑造了她对后续风险的评估:一方面,SARS-CoV-2远远没有埃博拉病毒那么致命;另一方面,她看到专家们在等待风险的确凿证据时行动太慢。
她说:“从我处理埃博拉病毒的背景来看,我宁愿过度准备,也不愿准备不足,因为我处于否认的境地。”
这里有一个更广泛的教训。我们可以尝试通过统计数据来了解世界,这些数据充其量提供了一个广泛和有代表性的概览,涵盖的内容远远超出了我们个人的感知。或者我们可以试着通过个人体验近距离了解这个世界。这两种观点各有利弊。
小额信贷先驱、诺贝尔奖获得者穆罕默德·尤努斯(Muhammad尤努斯)曾称赞“虫子眼”胜过“鸟瞰”,这是一个聪明的声音片段。但是鸟儿也能看到很多东西。理想情况下,我们既想要丰富的个人体验细节,又想要来自电子表格的更广泛、低分辨率的视图。当我们能够将两者结合起来时,洞察力就会出现--麦克德莫特就是这样做的。
在报道英国退欧公投、苏格兰独立公投、几次大选以及唐纳德·特朗普(Donald Trump)崛起背后的数字时,空气中弥漫着毒药:许多说法都是恶意提出的,对真相漠不关心,甚至信奉最明显的谎言,试图转移人们对这些问题的注意力。在一个人们不关心事实,只关心自己一方是否获胜的环境中进行事实核查,是一种吃力不讨好的经历。
有一段时间,在大流行期间做数据驱动型新闻的一个安慰是,它感到幸运地摆脱了这种政治部落主义。毕竟,人们渴望听到事实;真相很重要;数据和专业知识被认为是有帮助的。毕竟,这种病毒不会因为公交车上的一个谎言而分心。
这并没有持续多久。美国迅速两极分化,戴口罩成为政治身份的标志-更广泛地说,民主党人试图强调该病毒构成的威胁,共和党人追随特朗普总统,认为它夸大其词。著名的传染病专家安东尼·福奇(Anthony Fuci)给我的印象并不是一个党派人物--但美国选民不这么认为。32%的共和党人和78%的民主党人信任他。
最奇怪的例证来自共和党政治家赫尔曼·凯恩(Herman Cain)的Twitter账户,该账户在8月下旬的推特上写道:“看起来这种病毒并不像主流媒体最初所说的那样致命。”可悲的是,该隐在7月份死于新冠肺炎-但似乎政治两极分化是一种比死亡更强大的力量。
并不是每个问题都是政治两极分化的,但当一些事情被拖入政治舞台时,游击队往往会优先考虑部落归属,而不是考虑真相。例如,人们可以清楚地看到,受过高等教育的共和党人和民主党人在气候变化风险问题上的分歧比受教育程度较低的共和党人和民主党人更远。而不是带来某种共识,更多的教育年限只是。
.