美国选举地图中的颜色平衡选票差距和选票总数

2020-11-04 00:47:18

图表可以提供信息,知情的讨论可能比不知情的讨论更文明。但是图表也会误导人,所以当我们使用图表时,我们需要了解它在说些什么。2015年,我在TEDx上做了一次关于制作更清晰的选举地图的演讲。最初的录音丢失了,然后在今年夏天被找回并上传到YouTube上。随着选举季节的临近,我想通过谈论这张经常误导人的地图来继续讨论。

不同的图表设计用于不同的目的。上图是县级赢家通吃地图。我会简称它为县胜利者地图。科学家们用它来快速了解各县在选举中走的是哪条路。虽然可以说没有更好的地图来查看谁在哪个县获胜,但这张地图在用于其他目的时可能会产生误导。我们需要了解它的两个特点:

它没有表示每个县之间的相对投票人口。相反,它会让人们觉得每个县都有相同的人口。

它的设计并不是为了表达每个县的胜利幅度。它显示了谁在一个县获胜,即使他们只以一票之差获胜。毕竟,这是一个赢家通吃的图表。

美国可以被描述为人口稠密的地铁的集合,由人口较少的社区缓冲。下面是“人口山”的样子:

当我们拿着县赢家地图,调整每个县的土地面积,使之与其人口成比例时,美国看起来是这样的。

然而,地图的一个缺点是,许多领土的形状和位置扭曲得面目全非。这也许是为什么制图不是很主流的原因之一。

然而,县胜利者地图并没有传达这一相对人口信息。它的设计不是为了。但有人可能会认为是这样的。

在大选中,有50场同时进行的总统竞选,每个州一场。在这些州中的一些州,获胜的幅度被证明是非常小的。在新汉普郡,2016年大选中有743,117张选票投给了总统。希拉里·克林顿以2701票的优势赢得新罕布夏州。我们可以在一套高中橄榄球看台上坐尽可能多的人。

新汉普郡的投票率为75.03%,所以更多的人本可以投票反对特朗普。如果新汉普郡只有2702名合格选民行使投票权,投票给特朗普,那么新汉普郡就会转而投票给特朗普。由于毛发稀薄,2016年新罕布夏州既不蓝也不红。现在是50:50,根据交通和晚餐计划,是红色的还是蓝色的。把整个新罕布夏州都涂成蓝色或红色来代表总统候选人在全州的受欢迎程度是有误导性的。

这一特点在县级也是如此。在一个县落选的候选人可以获得相当多的选票。在许多县,获胜者以不到25%的优势获胜。

0的差值是50:50。克林顿在县级得票率的优势在左边。特朗普在县级得票率的优势在右边。黄色区域突出显示了得票率在25%以内的县。请注意,这些是百分比票数差距,而不是绝对票数差距。

总体而言,较小的县以较大的百分比优势获胜。较大的县以较小的百分比优势获胜。所以在得票最多的县,亚军也得了很多票。

这是县胜利者地图,当我们通过将每个县内的每一张红色和蓝色选票混合在一起来计算选票差距时,这是一个县获胜者地图的样子。紫色代表50:50:

中和地图旨在更清晰地表达选票差距。它使用灰色中介,根据人类感知紫色的方式进行调整。以下是2016年的中和地图:

很少有一个县的所有选票都投给一个候选人。然而,县胜利者地图并没有传达这一赢利信息。

毗邻的美国并不是非常毗邻。县胜利者地图无法表达投票人数和获胜幅度,这可能具有误导性。地图代表了人口,但它们扭曲了美国的形状,这可能会增加混乱。中和地图考虑了选票差距,但没有考虑人口。

我们能在不扭曲美国形状的情况下,构建一张既显示选票差距又显示投票人口的单一地图吗?

该地图利用颜色理论在二维尺度上表示选票边际和投票人口。

特朗普以高票数优势赢得了一个高度饱和的红色县。希拉里以很高的得票率赢得了一个高度饱和的蓝色县。

我们可以利用HSL颜色模型的这些单独组件来忠实地表达二维数据,例如2D色标上的投票总数与边际。

每个县的填充颜色是使用MuddyColor算法构建的,该算法表示为以下数学公式:

这将生成以下二维比例,该比例也同时用作贴图关键点,上面的围栏标记为2016年的数据集:

对于每个县的边界,我使用相同的公式,但只给它们一个50%的恒定亮度(L)。

这就产生了一维比例,我们将其用于县边界。它与中和地图中使用的色标相同,旨在更准确地表示选票边际。*Left=更高的DEM%利润率。RIGHT=更高的GOP%利润率。

给每个县一个不透明的边框颜色,即使是最浅的填满的县也可以被识别,包括他们的选票差距。

你不需要看整个国家,就能看到一个县的总票数在总体亮度尺度上的位置。“。县边框颜色和县填充颜色只在亮度上有所不同,因此县的边框颜色和填充颜色之间的对比度越大,其总得票率就越低。

一些县有足够的票数来歪曲总票数。以下是投票总数达到2514,055张时的图表,这是一个县的最大票数:

有人可能会建议使用对数标度将极高的离群值带到地球上。然而,这在视觉上会产生误导。对数比例使最小:最大投票总数比例从1:39,282变得更接近1:3.5,直观地将人口山区与人口平原等同起来。

我们维持一个线性的选票总数比例,并使用统计上栅栏来解释离群值。统计上围栏可以使用公式Q3+1.5*IQR来计算。由于县选票差距只与%DEM|%GOP有关,因此县选票总数为DEM+GOP。对于选票总数,我们计算的统计上限为59,828张DEM+GOP选票。我们需要记住,432个县的选票总数为≥59,828DEM+GOP,在泥泞的地图上是完全不透明的。

这些公式给了Muddy Map图一些有趣的特征。对于每个县,百分比选票差值以及选票总数(≤,统计上围栏)都嵌入到图表的颜色中。

只有两种色调,红色(色调#0又称色调#360)和蓝色(色调#240)。红色代表共和党获胜,蓝色代表民主党获胜。

得票率为0%的县将有0%的饱和度。这样的县将是纯粹的灰色,因为灰色在0%饱和度下出现。因此,一个县越接近50:50,它就越灰暗。2016年大选中没有一个县的得票率为0%。

总票数为0的县将有100%的亮度。纯白色显示为100%的亮度,因此选票总数越接近0,各县显示的白色越多。*2016年选举中没有一个县获得0票。

一个拥有≥59,828张总票数的县(统计上的栅栏)有50%的亮度。2016年大选的432个县都有这处房产。

如果计算机可以忠实地呈现公式所描述的所有颜色,那么您就可以使用颜色选择器来获得图表中各县的准确选票边际和选票总数。在人眼看来,泥泞的地图提供了一幅更真实的美国政治图景。

在一个充满欺骗性图表的世界里,我希望一张泥泞的地图能让事情变得更清楚一些。