弗雷谢特不等式-可视化、应用和历史

2020-07-03 02:45:50

这篇文章用现代可视化技术向读者介绍了弗雷谢不等式,并讨论了它们的应用和迷人的历史。

Fréchet不等式,也称为Boole-Fréchet不等式,是19世纪50年代由George Boole和Augustus de Morgan首创的概率逻辑的最早产物之一,并由Maurice Fréchet于1935年系统地形式化。在最简单的二元情况下,它们根据两个联合事件的边缘P(A)和P(B)给出了概率P(A,B)的界限:

在这些不等式首次发表84年后,重新审视它们的原因有两个:它们在机器学习和反事实推理中发挥着重要作用(Ang和珀尔,2019年)。

我们相信,对于同事和学生来说,使用现代动态可视化技术显示这些概率界限将会很有启发性。

Fréchet界有广泛的应用,包括逻辑(Wagner,2004)、人工智能(Wise和Henrion,1985)、统计学(Rüschendorf,1991)、量子力学(Benavoli等人,2016)和可靠性理论(Collet,1996)。在反事实分析中,当我们在治疗(X=x)和拒绝治疗(X=x‘)下有实验结果时,它们就成为焦点,我们的利益在于对治疗有反应的个人,即那些在接受治疗时会有反应而在拒绝治疗下不会有反应的人。这些人根据应用程序的不同而有不同的名字。他们被称为顺从者、受益者、回答者、易受骗的人、易受影响的人、易说服的人、易受影响的人、过度信任的人或易上当的人。正如读者可以理解的那样,它在市场营销、销售、招聘、产品开发、政治和健康科学方面的应用是巨大的。

虽然当我们同时拥有观察数据和实验数据时,可以获得更窄的界限(Ang和PEAR,2019年;Tian和PEAR,2000),但当仅从实验数据得出反应性结论时,Fréchet界限仍然是信息丰富的。

下面,我们以各种形式展示事件A和事件B的Fréchet不等式的动态可视化。悬停或点击I图标可查看每种类型的绘图的简短描述。单击或轻触一种绘图类型以查看当前绘图变形为新绘图的动画。将鼠标悬停或轻触绘图本身以查看该位置的信息弹出窗口。

这些图使用逻辑合取P(A,B)和逻辑析取P(A∨B)来可视化两个事件的概率界限,并将它们的边缘P(A)和P(B)作为单位正方形上的轴。P(A)和P(B)的特定值的边界可以通过单击合取或析取旁边的边界类型并将绘图上的位置跟踪到蓝色和红色之间的颜色来查看。绘图旁边的颜色条表示概率。单击不同类型的边界可为绘图设置动画,以演示边界是如何更改的。将鼠标悬停在该图上或点击该图可显示有关所指位置的更多信息。

在单位正方形的边缘附近,上下界之间的差距变得几乎为零,这意味着我们可以精确地确定相交的概率,这意味着给定边缘概率的概率就可以准确地确定相交的概率。极差图非常清楚地说明了这一点,它们是P(A,B)和P(A∨B)的完全相同的图。请注意,中心具有最宽的间隙。每个图都围绕P(B)=P(A)对角线对称,这应该是预期的,因为P(A)和P(B)在Fréchet不等式中扮演可互换的角色。

假设你测量了你的朋友喜欢数学和喜欢巧克力的概率。让A代表朋友随机选择的喜欢数学的事件,B代表朋友随机选择的喜欢巧克力的事件。结果是P(A)=0.9(你几乎所有的朋友都喜欢数学!)。P(B)=0.3。你想知道一个朋友既喜欢数学又喜欢巧克力的概率,换句话说,你想知道P(A,B)。如果知道一个朋友是否喜欢数学并不影响他们喜欢巧克力的概率,那么事件A和B是独立的,我们可以得到P(A,B)的精确值。这是A和B的逻辑合取,因此在绘图上方的“合取”旁边,单击“独立”。在绘图中追踪水平轴P(A)位于0.9,垂直轴P(B)位于0.3的位置。根据右边的色条,你会看到P(A,B)大约是0.27。

然而,也许享受巧克力会让你更喜欢数学。巧克力中的咖啡因可能与此有关。在这种情况下,A和B是相关的,在没有更多信息的情况下,我们可能无法获得P(A,B)的精确值。单击“合取”旁边的“组合”。现在在该图上再次跟踪(0.9,0.3)。你会看到P(A,B)在0.2和0.3之间。在不知道A和B有多大依赖的情况下,我们得到了一个朋友既喜欢数学又喜欢巧克力的概率相当狭窄的界限。

假设我们正在进行一个营销实验,发现如果显示广告1会有20%的客户会购买,而如果显示广告2会有45%的客户会购买。我们想知道有多少客户会受到广告2而不是广告1的影响。换言之,如果显示广告2会购买多少客户,而显示广告1则不会购买?要在上面的情节中看到这一点,让A表示当显示广告1时客户不会购买的事件,让B表示当显示广告2时客户会购买的事件:P(A)=100%-20%=80%=0.8,P(B)=45%=0.45。我们要找P(A,B)。此联合概率是逻辑合取,因此单击“合取”旁边的“下限”。跟踪P(A)=0.8和P(B)=0.45落在对应于0.2到0.3的蓝色条带的中间。这是下限,所以P(A,B)≥为0.25。现在点击“上限”并再次追踪。你会发现P(A,B)≤为0.45.。“组合”图允许您同时可视化这两个边界。将鼠标悬停在位置(0.8,0.45)上或点击位置(0.45)将显示任何地块的完整边界。

我们可能认为正好有45%-20%=25%的客户受到广告2的影响,但图表显示的范围在25%到45%之间。例如,如果广告2说服与广告1完全不同的客户群购买,那么在看了广告1之后将购买的20%的客户中没有人会购买如果他们看到了广告2就不会购买了,这是因为一些人可能会在显示广告1的情况下购买,如果广告2显示的是广告2,则广告2说服与广告1完全不同的客户群购买,那么在看到广告1之后购买的20%的客户中没有人会购买。在这种情况下,所有45%看过广告2后会购买的顾客都会受到广告的影响。

假设我们进行一项对照随机实验(CRT)来评估某些治疗X对存活率Y的疗效,但没有发现任何效果。例如,10%的接受治疗的患者痊愈,90%死亡,而对照组(那些被拒绝治疗的患者)的比例完全相同,10%的患者痊愈,90%的患者死亡。

这样的治疗无疑会被FDA和其他公共政策制定者认为是无效的。但健康科学家和制药商可能有兴趣了解这种治疗是如何影响个别患者的:它对任何一个人都没有影响,还是可能治愈了一些人,杀死了另一些人。在最坏的情况下,人们可以想象这样一种情况:如果不治疗,在治疗中死亡的人中有10%会被治愈。这种噩梦般的情景肯定会引起卫生科学家的严重关注,更不用说正在寻求或使用这种治疗的患者了。

设A代表患者约翰如果接受治疗将死亡的事件,B代表如果拒绝治疗约翰将存活的事件。实验数据表明,P(A)=90%,P(B)=10%。我们感兴趣的是约翰如果治疗就会死亡,如果不治疗就会痊愈的概率,即P(A,B)。

检查图1,我们发现P(A,B),约翰是那些对治疗有不良反应的人的概率在0到10%之间。这是一个相当令人震惊的发现,但并不完全出乎意料,因为随机实验处理的是总体的平均值,并不能为我们提供关于个人反应的信息。我们可能会问,什么实验结果可以保证约翰不会受到不利影响。检查“上限”图,我们可以看到,要保证概率小于5%,P(A)或P(B)必须低于5%。这意味着无论接受治疗还是不接受治疗,死亡率都应低于5%。

在数学表示法中,一般的Fréchet不等式的形式为:MAX{0,P(A1)+P(A2)+…。+P(An)−(n−1)}≤P(A1,A2,…。,An)≤min{P(A1),P(A2),…。,P(An)}。

MAX{P(A1),P(A2),…。,P(An)}≤P(A1∨A2∨…。∨A n)≤min{1,P(A1)+P(A2)+…。+P(An)}。

Maurice Fréchet是一位重要的法国数学家,他在点集拓扑、度量空间、统计和概率以及微积分方面做出了贡献(Wikipedia贡献者,2019年)。Fréchet于1935年在法国期刊“数学基础”(Fundamenta Mathaticae)上发表了他对上述不等式的证明(Fréchet,1935)。在此期间,他是索邦大学微分和积分学教授和主席(SACK,2016)。

莫里斯的父亲雅克·弗雷切特(Jacques Fréchet)是巴黎一所学校的校长(奥康纳和罗伯逊,2019年),当时莫里斯还很年轻。莫里斯随后上了中学,在那里他接受了法国传奇数学家雅克·哈达玛(Jacques Hadamard)的数学教学。不久之后,哈达玛将成为波尔多大学的一名教授。最终,哈达玛成为弗雷切特的博士导师。莫里斯和他的父亲一样是一名教育家,1907年是一名学校教师,1908年是一名讲师,然后在1910年成为一名教授(Bru和Hertz,2001)。概率研究出现在他生命的后期。不幸的是,他的工作并不总是像著名的瑞典数学家哈拉尔德·克拉梅尔(Harald Cramér)所写的那样受到赞赏(Bru和Hertz,2001):

“早些年,弗雷谢就是一位杰出的数学家,他在泛函分析方面做了开创性的工作。他在相当年长的时候就从事了概率论工作,我必须说,他在这一领域的工作对我来说似乎并不是很令人印象深刻。“。

尽管如此,弗雷谢特将继续在概率和统计学方面变得非常有影响力。作为对Cramér以前批评的一个很好的回应,一个重要的界是以Fréchet和Cramér命名的,Fréchet-Darmois-Cramér-Rao不等式(尽管更常见的是Cramér-Rao界)!

Fréchet不等式也被称为Boole-Fréchet不等式的原因是,George Boole在他1854年出版的“思想法则的调查”(Boole,1854)一书中发表了对这些不等式的合取版本的证明。在第19章中,布勒首先展示了以下内容:

n(Xy)的较大限制=值n(X)和n(Y)中的最小值n(Xy)的较小限制n(Xy)=n(X)+n(Y)-n(1)。

术语n(Xy)、n(X)和n(Y)分别是xy、x和y的出现次数。术语n(1)是出现的总次数。读者可以看到,将所有n项除以n(1)可得到P(x,y)的二元Fréchet不等式。布勒随后得出两个一般性结论:

1.。任何成分所代表的类别的主要数值极限将通过在成分的每个因子上分别加上前缀n,并取结果值中的最小值来找到。他们排在第二位。将上述所有值加在一起,并从结果中减去n(1)的值的多个减去一倍,即可得出次要极限。

这一结果是一项雄心勃勃的计划的一部分,他在第17章的“建议四”中描述为:

给定任何事件系统的概率;用一般方法确定任何其它事件的结果概率或导出概率。

我们现在知道布尔的任务是超级艰巨的,即使在今天,我们也不知道有任何软件可以在任何数量的活动上完成他的计划。Boole-Fréchet不等式是对他的远见的赞颂。

布尔的合取不等式比弗雷谢的早81年,那么为什么这些不被称为布尔不等式呢?原因之一是Fréchet表明,对于合取和析取,当只有边际概率已知时,它们是最窄的可能界限(Halperin,1965)。

布尔在他的书的第19章中写了一个脚注,布尔的合作者奥古斯都·德·摩根(Augustus De Morgan)首先提出了两个变量合取的次要极限(下界):

NXY的次要限制是由德摩根教授应用于三段论形式的,他似乎是第一个给出这个限制的人:在某家公司,大多数男性都有外套。她说,同一家公司的大多数男性都穿着马甲。因此,公司里的一些人有外套和马甲。

德·摩根在他1859年的论文“关于三段论和关系的逻辑”(德·摩根,1859)中写到了这一三段论。布尔和德摩根在1842年布尔给他写信后成了终身的朋友(伯里斯,2010年)。虽然德·摩根是布尔的学长,并在1835年出版了一本关于概率的书,在1847年出版了一本关于“形式逻辑”的书,但他在符号逻辑方面从未达到布尔的高度。

早于弗雷谢、布尔和德摩根的是查尔斯·斯坦霍普的演示逻辑机,这是一种实际的物理设备,可以计算合取和析取的二进制弗雷谢不等式。罗伯特·哈雷在1879年写了一篇文章:心理学和哲学的季度回顾(哈雷,1879年),描述了斯坦霍普的工具。除了制造了几台这样的机器外,斯坦霍普还有一份未完成的逻辑手稿,他在1800年至1815年间写道,描述了机器的规则和结构,以“发现逻辑中的结果”。在斯坦霍普的手稿中,他描述了计算α,β和μ的合取下限,其中α和β代表所有、一些、最少、最少、一个数字或部分与整体的一定比例(但不是没有),而μ是统一的:“α+β-μ衡量A和B之间的后果的程度。”这就给出了“次要限制”。哈雷给出了一些例子。其中之一是北侧悬挂的5幅画中的一些和5幅画中的一些是肖像,这并不能告诉我们有多少幅画是悬挂在北方的肖像画。但是如果五分之三挂在北面,四分之四是肖像,那么北面至少有五分之三+四五-1=二分之一是肖像。同样,按照德摩根的外套三段论,“(大多数+大多数)男人=一些男人”既有外套又有背心。

演示逻辑机的工作原理是将红色透明玻璃从右侧滑过从左侧滑过的单独的灰色木质幻灯片。重叠部分将显示为暗红色。幻灯片表示概率P(A)和P(B),其中滑动中间正方形的整个距离表示概率为1。读者可以验证暗红色(重叠)等于下限P(A)+P(B)-1。要找到“主要极限”或上限,只需将红色透明玻璃从左侧滑动到灰色幻灯片的顶部即可。两张幻灯片中较短的一张将出现暗红色,min{P(A),P(B)}!

维基百科贡献者,“弗雷谢特不平等”,en.wikipedia.org,第段。1,2019年8月4日。[在线]。可用:https://en.wikipedia.org/wiki/Fréchet_inequalities.。[2019年10月7日访问]。

李昂和朱迪亚·珀尔,“基于反事实逻辑的单元选择”,加州大学洛杉矶分校认知系统实验室,技术报告(R-488),2019年6月。载于2019年第二十八届国际人工智能联席会议(IJCAI-19)会议记录,1793-1799。[在线]。可用:http://ftp.cs.ucla.edu/pub/stat_ser/r488-reprint.pdf.。[访问时间:2019年10月11日]。

卡尔·G·瓦格纳,“莫德斯·托伦斯概率化”,“科学哲学杂志”,第一卷。55页,第747-753页,2004年。[在线连载]。可用:http://www.math.utk.edu/~wagner/papers/2004.pdf.。[2019年10月7日访问]。

本·P·怀斯(Ben P.Wise)和马克斯·亨里昂(Max Henrion),“不确定推理系统与概率比较的框架”,载于“学报”。第一届人工智能不确定性会议(UAI1985),1985年。[在线]。可用:https://arxiv.org/abs/1304.3430.。[2019年10月7日访问]。

L·Rüschendorf,“弗雷谢特界及其应用”,“给定边际概率分布的进展”,“数学及其应用”,第151-187页,1991。[在线]。可用:https://books.google.com/books?id=4uNCdVrrw2cC.。[2019年10月7日访问]。

Alessio Benavoli、Alessandro Facchini和Marco Zaffalon,“量子力学:推广到厄米矩阵空间的贝叶斯理论”,“物理评论A”,第一卷。第94期,第4期,第1-26页,2016年10月10日。[在线]。可用:https://arxiv.org/abs/1605.08177.。[2019年10月7日访问]。

J·科莱,“关于稀有事件近似的一些评论”,“IEEE可靠性学报”,第一卷。45,第1期,第106-108页,1996年3月。[在线]。可用:https://ieeexplore.ieee.org/document/488924.。[2019年10月7日访问]。

维基百科贡献者,“Maurice RenéFréchet,”en.wikipedia.org,段落。1,2019年10月7日。[在线]。可用:https://en.wikipedia.org/wiki/Maurice_René_Fréchet.。[2019年10月7日访问]。

Maurice Fréchet,“Généralisations du théorème des Proposités Totales”,“数学基金会”,第一卷。25,第1号,第379-387页,1935年。[在线]。可用:http://matwbn.icm.edu.pl/ksiazki/fm/fm25/fm25132.pdf.。[2019年10月7日访问]。

Harald Sack,“Maurice RenéFréchet和抽象空间理论”,科学嗨博客,9月1日。2016年。[在线]。可用:http://scihi.org/maurice-rene-frechet/.。[2019年10月7日访问]。

J J O‘Connor和E F Robertson,“RenéMaurice Fréchet,MacTutor数学史档案”。[在线]。可用:http://www-groups.dcs.st-and.ac.uk/history/Biographies/Frechet.html.。[2019年10月7日访问]。

B.Bru和S.Hertz,“Maurice Fréchet,世纪统计学家”,第331-334页,2001年1月。[在线]。可用:https://books.google.com/books?id=6DD1FKq6fFoC&;pg=PA331.。[2019年10月7日访问]。

乔治·布尔:“逻辑和概率数学理论所依据的思维规律的调查”,剑桥:麦克米伦和公司,1854年。[电子书]古腾堡计划提供:https://books.google.com/books?id=JBbkAAAAMAAJ&;pg=PA201&;lpg=PA201.。[访问时间:2019年10月11日]。

西奥多·海尔佩林,“美国数学月刊”,第一卷。72,第4期,第343-359页,1965年4月。[摘要]。可用:https://www.jstor.org/stable/2313491.。[访问时间:2019年10月11日]。

奥古斯都·德·摩根,“论三段论”和“关于关系的逻辑”,1859年。可用:https://books.google.com/books?id=t02wDwAAQBAJ&;pg=PA217.。[访问时间:2019年10月11日]。

罗伯特·哈雷,“心灵:心理学与哲学季评”,1879年。可用:https://books.google.com/books?id=JBbkAAAAMAAJ&;pg=PA201.。[访问时间:2019年10月11日]。

金田和朱迪亚·珀尔,“因果关系的概率:界限和识别”。在Craig Boutiler和Moises Goldszmidt(编辑)中,人工智能不确定性会议论文集(UAI-2000),加利福尼亚州旧金山:Morgan Kaufmann,589-598,2000。可用:http://ftp.cs.ucla.edu/pub/stat_ser/R271-U.pdf.。[2019年10月31日访问]。

斯坦利·伯里斯(Stanley Burris),“乔治·布尔”(George Boole),“斯坦福哲学百科全书”,2018年夏天,爱德华·N·扎尔塔(Edward N.Zalta)编辑。可用:https://plato.stanford.edu/archives/sum2018/entries/boole/.。[访问时间:2019年10月11日]。