概率是真的吗?

2020-11-28 22:18:15

今天,我想用涉及机会的陈述来解决一个问题。为了演示,让我们首先考虑一个不涉及机会的陈述:

“被扔到平坦表面上的立方模具将停在其六个侧面之一上。”

该声明可以通过各种骰子和表面进行经验测试。如果我们的任何一项实验导致模具在一个角上不断旋转,我们将证明这一说法不成立。我们可能必须完善索赔条件;例如,通过要求重力的存在。尽管如此,很清楚该陈述是对还是错意味着什么。现在,我们尝试提出涉及概率的声明:

“如果掷出一对标准骰子,其正面朝上的总和等于9的概率将是九分之一(约0.11或11%)。”

此陈述正确是什么意思?与第一个语句不同,该语句没有指定我们实际看到的结果。我们怎么可能希望对其进行测试或利用其信息?

在抽象数学领域,我们可以根据自己的直觉自由地对概率建模。想象一个包含无限可能世界的多重宇宙,其总度量为100%。将事件的概率(例如掷9的概率)定义为分配给事件实际发生的世界子集的度量。

在抽象形式主义中,我们可以根据自己的意愿分配度量,但要遵循Kolmogorov的公理:度量必须是非负的,可累加的,并且总计为100%。通过尊重理想模具的对称性,我们可以争辩说只有这样一种分配才有意义;从中我们可以计算出任何涉及掷骰子的事件的概率。

这种方法有两个缺点。首先,我们将不会总是处理可以直接使用先验参数的对称对象。因此,我们仍然需要一种使用实际观察来测试概率声明的方法。其次,这样的论点永远不可能是密不可分的:毕竟,当我们仅经历一个世界时,我们怎么能希望在一个假设的多重宇宙上推断出该量度?实际上,一个现实主义者可能会质疑讨论事件发生的可能性是否有意义:它发生了还是没有发生!

您可能会更信任将钱放在嘴边的人。为了支持明确的要求而不涉及机会,我可以同意在事实证明我错了的情况下支付罚款。

这个想法可以通过以下方式扩展到概率索赔:考虑一张彩票,如果下一双骰子产生9张,则该彩票支付90美元的头奖。如果我愿意支付的最高赔付是$ 10,则表明我相信非九掷骰子的机率是九掷骰子机的八倍。这种方法之所以吸引人,是因为概率论的根本理由是要解释面临不确定性的个人的决策。

如果另一位赌徒的观点与我的观点相抵触,您可以通过建立一个买卖我们预测的市场来汇总我们的信念。考虑发生指定事件时支付$ 100(加上利息)的合同。它在市场上的价格可以解释为该事件的概率百分比。因此,说一个事件是另一个事件的“可能性”的两倍,仅表示事件的市场价格是两倍。

与典型的赌徒不同,无摩擦的市场提供透明的近乎相同的买卖价格。结果,任何违反Kolmogorov公理的行为都会成为套利机会。套利活动是公理的执行者,创造了经济学家所谓的风险中性概率测度。

但是,在实际市场中,这种概率测度显示出一些不一致之处。首先,这取决于使用哪种货币:举一个极端的例子,我们不会购买仅在美元崩溃时才支付的以美元计价的赌注,无论我们想象崩溃的可能性如何。其次,该措施对(不可分散的)风险敏感:如果一个广为人知的预言认为将9滚动会导致灾难性的饥荒,那么市场将更加重视这一结果,因为每个人都希望购买针对这种风险的保险。灾难。第三,市场可能会被误导:确实,参与市场的动机之一就是试图击败它!最后,流动市场很难建立。

由于这些原因,我们放弃了这种方法。我们将尝试根据实际结果而不是人类的赌注来定义概率。尽管如此,人类的赌注还是激发了概率论创造的动力:很难想到任何其他实际应用!因此,一旦发现了具有吸引力的概率概念,我们应该记住重新审视此事。最终,我们必须能够解释个人和市场如何遵守我们的概念,并回答他们为什么应该对此完全关心。

这些问题非常微妙:自然选择的进化理论告诉我们,人们倾向于使用能够使祖先生存的策略;然而,概率性信念的本质是各种各样的结果都是合理的。确实,虽然硬币总是会落在正面或反面,但将您的生命储蓄押在正面或反面是不明智的。从直觉上讲,基本原理是,如果您继续这样玩下去,您几乎肯定会最终输掉。这种反复试验的想法激发了我们的下一个解释,这恰恰是科学家中最受欢迎的一种解释。

根据常客主义的思想流派,概率表述不应从字面上理解。尽管它涉及单个事件,但该声明应作为涉及大量类似事件的索赔的简写。想象一下,一遍又一遍地掷骰子。我们开始时的概率主张被转换为以下形式:

“如果一双标准骰子反复投掷,那么在投掷次数达到无穷大的极限时,九分之一的比例会收敛到九分之一(大约0.11或11%)。”

短期概率被长期比例代替。给定无限的滚动顺序,此语句明确地表明自己是对还是错。根据常人性的解释,我们甚至可以更加理解我们以前的解释。虽然我们仅体验一个世界,但在相似条件下重复实验就像在平行宇宙中观察实验:无论我们是对试验还是世界进行计数,数学实际上都是相同的。在无限多下注的范围内,我们也可以对赌徒的策略质量做出一些明确的结论:这就是赌场如何确保赌城总是赢的!

测试我们的主张很简单:我们将骰子一遍又一遍地滚动,并不断重复……无限次。哎呀。当然,没有像无穷大试验这样的东西。我们的手臂会疲劳,骰子会磨损,太阳会爆炸,宇宙中所有的自由能都将被消耗掉。充其量,我们可以进行大量的试验。假设我们掷骰子9,000次;其中九分之一就是1,000。也许我们不会精确地滚动1,000个9,所以让我们以适当的误差范围(称为置信区间)来解释我们的主张:

“如果将一对标准骰子投掷9000次,那么朝上的一面将合计9次,投掷次数介于920和1,080之间。”

获得920至1,080个9之间的概率可以计算为99.3%。 2因此,我们已经将概率陈述变成了更加确定但仍然是概率的陈述。如果我们观察到1,100个9,则我们应该能够将概率论断为虚假。但是,如果地球上的每个家庭都独立进行这个9,000次投掷实验,我们应该期望他们的许多结果都落在置信区间之外。他们不同意我们陈述的真实性!

没有解决的办法:尽管它具有直观的吸引力,但概率论的常识性定义是循环的,从而将概率要求降为概率要求。 3为了结束周期,常客选择一个阈值(例如99%),超过该阈值将事件视为客观事实。这赋予了权利要求以经验可观察的含义。然而,常客必须注意不要考虑太多此类事件,否则,至少其中一个事件失败的可能性也可能超过确定性的阈值:逻辑上的矛盾。

只有在无限样本大小的限制下,事情才能顺利进行。统计学家主要处理可以重复多次的实验,以至于在大多数实践中,他们的结论可以被视为确定的。非哲学家通常乐于忽略不到1%的错误机会;如果还不够,那就加0.0001%!可以通过收集更多数据来增加信心,即增加样本量。

事实证明这种方法非常强大。通过设计概率根据上下文变量而变化的更复杂的假设,甚至可以对某些不易重复的现象进行统计分析。例如,天气预报基于经过良好测试的模型,该模型使用诸如温度,压力,湿度和风等变量的测量值。

另一方面,体育比赛,民主选举或公司股票的统计模型往往难以检验:相互作用非常复杂,无法从中推断出太多结果。同样,当您尝试预测哪些大学会录取您,或者哪些朋友将会创业时,则无需使用可重复的测试。显然,常人的解释不适用。可能有人争辩说,在这些情况下没有任何结论符合科学标准。但是,如果我们寻求在不确定性下进行决策的理论,那么就不能否认此类案件的重要性和普遍性。

从根本上讲,涉及概率的问题是不恰当的:不可能推断出与我们的经验无关的任何事物,更不用说为它们分配度量了。即使我们认为概率论的多元宇宙是真实的(无论意味着什么!),每个世界也将与其他世界一样真实,并可能会有自己的居民问同样的问题。与体积之类的物理量不同,概率度量没有明显的结果。

那么,为什么概率对我们具有如此突出的直观意义呢?令我们感到惊讶的所谓“不太可能”的事件是什么呢?回想一下,自然选择的进化是一场数字游戏:您可以承受一些错误,但重要的是多于对错,并进行相应的计划。在我们错了的时候,我们在调整计划和对未来的期望时会感到有些震惊。这与常客主义的解释是一致的:“可能”的事件是在大量类似情况下发生的频率更高的事件。

不能解释为大量场景中的频率的主张呢?说有可能存在(或不存在)地球外生命是什么意思?生活在一个不太可能的宇宙中,这意味着什么?如果骰子已经存在,那么骰子掷骰子落在双六点子上的频率要比它们应该出现的频率高得多?从技术上讲,我们对自己的世界物理学所了解的一切都不能阻止这一点:我们可以在很大程度上获得“幸运”。但是,这个宇宙的居民会怎么想呢?我想他们根本不会认为自己的世界是不可能的:他们只会在他们对物理学的描述中添加新的定律:所有骰子,似乎都是通过神的干预而被视为表现出这种奇怪的行为。尽管这使物理学变得相当尴尬,但就预测准确性而言,它肯定会产生更好的理论。我们也许还希望他们的宗教能够赋予骰子以精神上的意义。

科学的询问方法可以承受涉及骰子的单个奇数模式。但是,如果宇宙是乱七八糟,复杂,不规则的,那么它的随机性就没有任何规律。然后,似乎所有事件都是由神的干预决定的。在这样的世界中,科学将毫无作用。古代人相信在一个神秘的世界中,从天气到动物形态,所有事物都受到神的日常异想天开。然而,即使是古代人也相信一些基本的模式,他们可以用来做饭,打猎,航行,建造庇护所或其他方式生活。没有可利用的模式,就没有理由出现聪明的生活。我们宇宙的基础是一个简单的秩序,这是它最显着的特征之一。

让我们看看是否可以将概率和简单性之间的模糊联系发展成为一个具体的想法。我们最大的线索是常人思想家提出的一个问题:该假设最初来自何处?

如果我们不知道要检验哪个假设,则可以从考虑每个想到的假设开始:可能有成千上万,数百万甚至无数个假设。在骰子实验中,我们可能会考虑一些奇怪的假设,例如,翻倍翻倍的机会取决于最近几轮掷出哪个名人的信用卡号。假设,对于每个假设,我们设计一个测试(根据理想的骰子模型)以99%的概率失败。然后,平均而言,每100个假设中的一个将通过检验。

是什么使“真实”的假设在众多假货中脱颖而出?好吧,这些假货不太可能经受额外的测试。我们收集的数据越多,我们必须诉诸的假设就越容易被误解;尽管如此,仍然有可能将错误的假设适用于到目前为止所看到的所有数据。在科学上,这是一个非常严重的问题,因此得名:过度拟合。

不知何故,我们必须缩小假设范围。也许您认为这很容易:只有少数假设描述了合理的骰子行为;其余的显然是荒谬的!但是现在您要依靠直观的判断,而不是严格的方法。如果您尝试整理出关于骰子应该如何运作的直觉知识的来源,您会发现它扎根于您之前对世界运作方式的了解,而这些知识本身必须经过各种假设的检验。如果您具有良好的先验知识并坚守信念,那么这在实践中会很好。但是,它严重地提出了一个问题:我们如何设法获得有关我们所生活的世界的任何知识?

有一个解决这个难题的办法。在大多数历史中,没有人知道如何用精确的数学术语表述它。因此,它仅限于哲学领域。解决过度拟合的方法是Occam剃刀的简约法则:

如果我们用“简单”来表示必须用简短的英语句子来描述,那么此类句子的数量就非常有限。在简单的假设中,我们可以在有限的试验中消除所有不好的假设。

因此,我们看到常客主义方法需要使用先验知识,并最终使用诸如奥卡姆剃刀之类的原理。我们是否可以将此想法发挥到极致,以期通过频繁性缓解其他问题?计算机科学的出现为我们提供了一个理论框架。随之而来的是推论Occam剃须刀前端和中央的一般推论。

英文句子可能有点模棱两可,因此,为了精确起见,我们将假设表达为计算机程序,并将观察结果编码为计算机数据。但是,如果您不是程序员,请放心,用您的母语编写的说明来替换我们讨论中的程序通常是犹太洁食。 4在计算机科学框架中,我们将Occam的剃须刀重述如下:

让我们看看这个定义有多强大。马上,我们发现不再需要仔细选择假设或检验,因为它们都是内置的:所有计算机程序都是假设,优先考虑较短的假设。测试一个程序就等于验证其输出与我们的观察记录完全匹配。

乍一看,使用确定性程序的要求似乎是一种限制。幸运的是,通过提供“硬币翻转”的结果作为额外的一串和一串零,可以使随机程序具有确定性。此字符串会使程序变长,因此,如果存在,Occam的剃刀将更喜欢那些不依赖太多随机性的解释。

给定一个字符串\(x \),它可能表示很长的观测序列,输出\(x \)的最短程序的长度称为Kolmogorov复杂度\(K(x)\)。通过按程序的长度对程序进行优先级排序,我们可以确保每个现有理论仅具有有限的许多相互竞争的假设。尽管可以通过其他标准对程序进行优先级排序,但事实证明,Kolmogorov复杂度在恒定的范围内主导着每个部分可计算的替代方案。有关出色的技术参考5,以及更易于访问的概述,请参见脚注。 6我们在这里将不深入探讨该理论,而仅强调其如何帮助我们解释和推断概率陈述。

古典信息论研究了可压缩随机对象的最佳速率。如果从已知概率分布\(\ mathcal P \)中提取对象,则平均而言,压缩一个对象所需的位数等于称为熵的量\(H(\ mathcal P)\) 。平均而言,没有压缩算法能胜过这一点。总的来说,我们是否应该关心平均值,而不是中位数,众数,最大值或其他一些统计数据,这值得怀疑。

但是现在,假设我们从\(\ mathcal P \)中独立地采样了大量\(N \)个对象。大数定律使总数与平均值成正比:几乎可以肯定,整个对象序列的总编码长度将非常接近\(N \ cdot H(\ mathcal P)\)。序列的Kolmogorov复杂度不会太大:一个合适的程序包括\(\ mathcal P \)的描述以及序列中每个对象的经典编码(针对\(\ mathcal P \)进行了优化),用于总复杂度约为\(K(\ mathcal P)+ N \ cdot H(\ mathcal P)\)。

如果没有一个程序明显更短并生成相同的序列,那么上面的程序就很好地解释了该序列:它是最简单的。也就是说,我们现在可以查看一个单独的字符串,没有先验的概念是随机的,然后得出结论,它看起来像是从\(\ mathcal P \)随机抽奖的序列。例如,考虑以下顺序:

这不会作为一对骰子的随机掷骰子的方式通过,骰子的边编号为0到5。为什么?为了这样解释,我们必须为每个元素包括一个编码。尽管比按字面意思写序列短一点,但比短语“ pi的前40位数字”长得多。

如果有可能通过算法计算出输出给定\(x \)的最短程序,我们将拥有一个功能强大的可笑的推理引擎。例如,我们可以从物理学实验中获得大量数据,然后得出完整的科学理论,比我们今天所知道的要好。自然,这样的事情太好了,难以置信。由于与证明和计算理论相关的根本原因,因此无法计算Kolmogorov复杂度。 7因此,我们只能尽力发现我们能做到的最简约的解释,却不知道我们离最好的可能性有多近。奥卡姆剃须刀可以区分好坏假设,并且与纯粹的频繁性行为不同,它可以抵御粗暴的虐待

......