纳西姆·塔勒布VS内特·西尔弗:选举预测谁是对的?

2020-11-03 12:26:28

也许是在总统辱骂的旋风中迷失了方向,但在这个选举季,一场鲜为人知的多年不和在Twitter上重新浮出水面。内特·西尔弗(Nate Silver)是FiveThirtyEight的创始人,他是一位受欢迎的统计学家,经常被媒体成员要求就选举预测发表评论和提供专业知识。纳西姆·塔勒布(Nassim Taleb)是一位统计学家/量化哲学家,也许最出名的可能是“黑天鹅”(The Black Swan)一书的作者。他因在推特上辱骂人而名列第二。在2018年的这起事件中,他似乎对FiveThirtyEight的选举预测提出了异议,称“无耻的内特·西尔弗”“不知道数学是如何工作的”,以及其他一系列侮辱。西尔弗回应说,塔勒布是一个“既有知识又愚蠢”的人,这是塔勒布自己创造的一个短语。唉哟。一大群统计学家、数学家和数据科学家突然站出来表明立场。塔勒布本人在2020年10月10日加倍努力,再次称西尔弗“完全没有头绪”。

在这篇文章中,我看一看塔勒布论点背后的数学前提,并直观地解释它们为什么站得住脚。简而言之,尽管塔勒布的数学计算是合理的,但他仍然忽略了西尔弗预测的细微差别,从而设法错过了目标。

塔勒布的主要抱怨是,随着时间的推移,预测者的观点改变得太多了。看看FiveThirtyEight对2016年总统大选的预测,当时希拉里获胜的概率最高达到90%,并触及50%的低点。

塔勒布坚持认为,克林顿永远不应该获得90%的获胜概率。他说,即使当时的民调对克林顿的支持率很高,西尔弗也应该考虑到大选前几个月民调会发生变化的不确定性,或者是重大新闻爆出的可能性。如果西尔弗把“未知的未知因素”考虑在内,他的预测应该更接近50%。本质上,这个单一的数字应该反映当前和未来的所有不确定性。塔勒布通过量化金融学的方式构建了这一论点,这可能导致他和传统统计学家互相议论。在接下来的几节中,我将直观地介绍他的论点。

前提1:如果你给出一个概率,你必须愿意打赌。

对于经济学家、宽客和交易者来说,一个众所周知的事实是:如果我告诉你一个数字,我必须愿意按这个数字交易。如果我告诉你这栋房子的公允价值是50万美元,我一定愿意以这个价格买卖。否则,我给你的号码是没有意义的。同样,如果我告诉你拜登赢得这次选举的可能性是73%,我必须愿意支付0.73美元来打赌:如果拜登获胜,我将获得1美元,如果他失败,我将获得0美元。

这一点很重要,因为它将预测的概率转化为一种可交易的金融工具,称为二元期权。如果预测为50%,我可以在0.50美元买入该期权。如果预测移动到65%,我现在可以以0.65美元的价格卖出期权,从而获得0.15美元的利润。

这就把我们带到了另一个被称为无套利条件的重要原则。如果选举预测是准确的,交易员应该没有办法通过交易这个期权来赚到有保证的钱。举一个说明性的例子,假设我们生活在一个不变的世界里,候选人A获胜的概率固定在50%。如果一个民意调查员不日复一日地报告静态预测,他就会创造套利机会。我们会在预测高于50%时卖出,在下方买入。

好的,现在我们已经确定,如果套利条件存在,那么民意调查机构就是错误的,不应该在一开始就做出这个预测。尽管如此,在Silver的预测中是否存在套利条件还不明显(请记住,交易员确实可以接触到先知,他只有与民意调查人员相同的信息可用)。为了建立套利条件,我们还需要另外两块积木。

套用塔勒布的话说,如果我告诉你一件事发生的可能性为0%,我不能改变主意,明天告诉你,现在它发生的可能性是50%。否则我一开始就不应该告诉你它有0%的机会。概率和信心是密不可分的,民意调查机构预测的数字应该概括了这两者。走到另一个极端,如果不确定性非常高(因此信心很低),那么今天的民调说什么都无关紧要。我应该给两位候选人50%的获胜机会,因为我承认外部事件极有可能发生,导致今天的选举无效。用技术术语来说,最大不确定性意味着最大熵,而[0,1]区间上的最大熵分布是均匀分布,其平均值为0.5。下图(摘自本文)显示了在特定期权定价公式下概率(x轴)和波动率(y轴)之间的关系。

在这一点上,我们怀疑FiveThirtyEight的预测看起来不太对劲,因为它们似乎同时具有高波动性和高概率,这两者相互矛盾。不过,门槛在哪里呢?我们如何证明波动率过高呢?

现在我们要讲一点技术性的东西,说明无套利条件很可能被违反了。基本结构如下:

为了满足无套利条件,所有信息都必须“计入”到民意调查者的当前预测中。

鞅不能表现出趋势性或均值回归行为,因此Silver的预测违反了鞅性质,从而违反了无套利条件。

鞅的定义是一个随机过程\(X_1,X_2,…)。X_t\)满足。

[e[X_{t+1}|X_1,...,X_t]=X_t\]在非技术术语中,鞅属性表示过去的知识对预测未来的…没有用处。这其中的一个含义是,预测概率在竞选期间不太可能发生太大变化(Taleb,2017)。重大事件仍可能导致预测发生重大变化:例如,拜登或特朗普的一系列民调显示,他们的表现比以前好得多,这将转化为公众舆论转向对该候选人有利的推断。鞅性质的意义不在于这种情况不能发生,而在于这种转移的可能性应该在模型中预料到,达到与其先验概率相对应的数量。如果以很高的概率允许大的意见转变,那么在大选前几个月的选票份额预测应该会有相应的广泛不确定性,这反过来将导致获胜概率接近50%。

换句话说,所有信息都已经计入了当前市场的价格。如果不是这样的话,交易员可以利用还没有计入价格的信息来赚钱。那么我们需要检查的最后一件事是:Silver的预测有可能具有鞅性质吗?答案是否定的,这一点毋庸置疑。它表现出明显的均值回归行为,并且可以通过鞅假设的统计检验(例如,Kolmogorov-Smirnov检验)来验证。似乎塔勒布的数学在这里是正确的。那么他哪里出了问题呢?

我相信内特·西尔弗用他的选举预测回答了一个微妙的不同问题。Silver产生的每个数据点都在回答这个问题:如果选举在今天举行,每个候选人获胜的可能性有多大?我认为这是一个有效和有用的提法。换句话说,如果问题是“谁将赢得11月3日的选举?”,下面哪一个答案更令人满意?

“如果从现在到选举之间没有其他改变,拜登获胜的机率为85%。”(西尔弗的论点)。

“我不知道,从现在到选举之间什么事都有可能发生,我给两位候选人的机会都不会超过50%。”(塔勒布的论点)。

这是一个有根据的批评,也许西尔弗在解释他的数字代表什么方面不是很清楚,因此媒体错误地报道了他的预测。不过,我打赌大多数人会发现第一个答案更有用。在这种解读中,“金融工具”是一种每天都会到期的二元期权.。因此,西尔弗预测的时间序列不能解释为一个鞅,因为它将每天完全不同的工具的价格串在一起。

这也是一个有效的批评,即西尔弗在11月3日之前的预测完全没有意义,而在塔勒布的公式中,它有一个自然的解释,即每个候选人的投注赔率。西尔弗明确表示,他只根据自己最终的预测来判断他的模型。为此,他的模型经过了极好的校准,也就是说,当他说某件事有50%的可能性发生时,它实际上有50%的可能性确实发生了。

总而言之,塔勒布和西尔弗应该就民调机构的数字到底意味着什么进行一场哲学辩论,不要在Twitter上互相辱骂,这是无用的分心之举。

安德鲁·赫尔曼、奥布里·克莱顿、德鲁夫·马德卡和许多其他统计学家回应并给出了他们的想法:https://statmodeling.stat.columbia.edu/2020/10/12/more-on-martingale-property-of-probabilistic-forecasts-and-some-other-issues-with-our-election-model/