数据可视化提示

2020-08-06 22:53:28

在一个数据真的很重要的世界里,我们都想创建有效的图表。但学校很少教授数据可视化课程,也很少在在职培训中涵盖数据可视化。我们中的大多数人都是边学边学,因此我们经常做出让观众困惑和迷失方向的选择或错误。

从过分复杂化或夸大我们的图表,到传达完全不准确的信息,有一些常见的设计陷阱可以很容易地避免。我们将这些指针放在一起,帮助您创建更简单的图表,从而有效地理解数据的含义。

“只要有图表,大多数人就会相信你告诉他们的任何事情,”研究人员在2014年的一项研究中发现,“被科学蒙蔽了双眼”。考虑到图表的说服力,我们正确使用它们并将观众的最佳利益放在我们设计的核心位置是很重要的。图表有许多不同的方式可以意外地传达错误的信息、歪曲事实,或者使数据难以(如果不是不可能的话)快速解码和使用。

许多图表都有复杂而智能的底层信息,但它们的呈现方式无法传达预期的信息。

条形图是很好的比较工具。要判断它们的终点,这些栏应该从零基线开始。

为了让人们从条形图中得出有意义的结论,条形图必须完整呈现。要执行此操作,需要从零开始垂直轴。

条形图通常很容易阅读,因为它们“要求”我们的眼睛做一件简单的事情:比较条形图的相对高度。但是,如果我们只展示条形图的提示来夸大数据中的差异,我们的观众就失去了进行有用的视觉比较的能力。

唐娜·M·王(Dona M.Wong)写道:“删节等于歪曲。”因此,人们要么被误导,带走了错误的信息,要么最终不得不阅读数字,这违背了图表的目的。

折线图通常会显示一种趋势。拉伸图形的高度可能会产生虚假的戏剧性效果,而拉伸宽度可能会轻描淡写。

与拉伸或挤压的照片类似,图表的尺寸-或其纵横比-可以改变我们呈现的图像。但是,虽然照片中出现错误的纵横比通常无法逃脱惩罚,但图表中扭曲的纵横比很容易被忽视。无论这是夸大还是轻描淡写的信息,它都只是误导了你的受众。

数据可视化专家安迪·柯克写道:“就绘制图表的高度或宽度而言,没有单一的规则可遵循,但一个有用的概念是‘倾斜到45°’,即图表上的平均倾斜角朝向45°。”这可能是不切实际的衡量,但通过眼睛判断往往会起到作用。

饼图看起来很友好,但实际上很难看懂。在大多数情况下,您可以找到更好的替代方案。

饼图是面积图大家族的一部分,它们都很难解释。尽管如此,饼图在几乎所有的专业和教育环境中都被广泛使用和滥用。

最好避免使用饼图的原因很简单:我们的大脑无法准确估计或比较角度。数据可视化专家科尔·努斯鲍默·纳夫里克解释说,如果切片的大小相当接近,很难-如果不是不可能-区分出哪个更大,而当它们的大小不接近时,你最多只能确定一个比另一个大,但你不能根据大小来判断。

用饼图提供精确的数字需要付出很多努力,比如依赖可能不合适的直接切片标签,或者使用让我们的眼睛在饼图和图例之间来回跳动的图例。

比较面积或体积比比较长度更难。为了避免人们产生错误的印象,把它们作为最后的手段。

当我们被要求一次判断和比较两个维度时,例如,两个圆圈,我们很少做出准确的估计。我们通常低估大圆圈的大小,高估小圆圈的大小。这是因为我们本能地判断形状的长度或宽度,而不是它们的面积。

安迪·柯克写道:“尺寸计算的几何精确度是最重要的。”当构建或阅读比例形状图时,记住一条简单的规则是很有用的:当我们将一个圆的高度加倍时,我们实际上是它的面积的四倍,而不是两倍。记住,如果你决定让你的圆看起来像3D球体,你不再代表面积,而是体积。

法国作家安东尼·德·圣埃克苏佩里(Antoine de Saint-Exupery)说:“完美不是在没有什么可补充的时候实现的,而是当没有什么可拿走的时候。”

我们在处理图表时经常犯的一个错误是用不必要的元素过度修饰图表。常见的问题是颜色过多、图形杂乱和滥用特效。在我们的值中显示太多的小数位是另一个需要注意的问题。这样的细节不会给任何人留下深刻印象,但整理图表会给人留下深刻印象。

用颜色来传达信息,而不是用来装饰。颜色太多会使人迷惑和迷失方向。

在设计图表时,颜色既可以是你的朋友,也可以是你的敌人。根据我们如何使用它,它可以优雅地突出显示数据并显示更改,也可以造成视觉过载并迷惑观众。

数据可视化专家斯蒂芬·莱特写道:“当任何颜色与正常颜色形成对比时,我们的眼睛会注意,我们的大脑会试图赋予这种差异以意义。”太多的含义或颜色只会模糊你的信息,让人们偏离正轨。

此外,对于色盲读者来说,使用不同的颜色元素(如条形或线条)可能难以辨认。因此,您可以改变强度,也可以添加符号或数字以清楚地显示给这些读卡器。

唐娜·M·王(Dona M.Wong)说:“优雅地将颜色纳入排行榜,就像你会在家里接待姻亲一样。”

背景、边框、阴影、深色网格线和不必要的标签是你的敌人。驱逐他们以引起人们对数据的注意。

为了让人明白这一点,美国统计学家爱德华·塔夫特(Edward Tufte)在他最有影响力的一本书中创造了“图表垃圾”(ChartJunk)一词:“图形的内部装饰产生了大量的墨水,并没有告诉观众任何新的东西。装饰的目的多种多样--让图形看起来更科学、更精确,让陈列生动活泼,让设计者有机会锻炼艺术技巧。不管其原因如何,都是非数据墨水或冗余数据墨水,而且往往是ChartJunk。“。

简单的解决方案是用最少的墨水来传达你的信息,并去除任何让你分心的东西。这样,您就可以让您的数据和图表脱颖而出。正如阿尔贝托·开罗所说:“空白不是空白。”

除非您真的在绘制第三维,否则不要使用3D。它扭曲了数据,使比较变得更加困难。

大多数数据可视化专家一致认为,使用3D特效往好了说是不必要的,往坏了说则是令人迷惑和混乱的元素。安迪·柯克(Andy Kirk)写道,它“扭曲了观众在任何程度上都能接受的精确度内读取数值的能力”。

花哨的3D图表有一些非常吸引人的地方。然而,在大多数情况下,第三个维度-或深度-纯粹是装饰性的,这使得人们很难处理数据。在3D图表中,与前面相比,后面部分看起来更小,甚至被它隐藏起来,这使得对价值和比较的判断几乎是不可能的。此外,人们不知道3D形状上的哪个点要相对于轴比例进行测量。

在大多数情况下,3D图表对你和你的观众来说都是浪费时间和精力。

额外的小数位看起来令人印象深刻,意味着精确度,但它们通常是没有意义的。所以,在计划之前,后退一步,对数字进行舍入。

通过显示太多小数位来夸大数据的数字精度可能会使您的图表看起来很准确,但这种特殊性只是误导。即使你没有夸大你的数据的精确度,你的数字也是真正准确的,让你的观众过多地了解这样的细节往往是无用的。

斯蒂芬·莱斯写道:“为数字选择合适的精确度水平归结为单一的设计实践:精确度水平不应超过服务于你的沟通目标和读者需求所需的水平。”

只需记住,当使用的精确度低于可用精度时,重要的是让您的观众了解情况。

图表都是为了让广大受众能够访问数据。这并不意味着你需要将事情过于简单化或简单化--只要直截了当地表达你的观点,而不是把事情搞得过于复杂就行了。

当人们难以解读图表时,往往会质疑自己的智力,并责怪自己。但在大多数情况下,这不是人的错,而是设计的错。

简单的东西和复杂的东西相对容易。要把一些复杂的东西以观众可以理解的方式呈现出来要困难得多。目标是直截了当的。

短信是你的朋友。深思熟虑地使用标签意味着没有人被蒙在鼓里。每个图表和每个轴至少需要一个标题。

在使图表变得可访问方面,注释是最直接,但通常是最容易被忽略的步骤。添加简短而相关的正确文本,可以帮助人们利用他们的脑力来理解数据,而不是弄清楚图表。

科尔·努斯鲍默·纳夫里克建议说:“文本在与数据的交流中扮演着多种角色:用它来标记、介绍、解释、强化、突出、推荐和讲述一个故事,”科尔·努斯鲍默·纳夫里克(Cole Nussbaumer Knaflic)建议。

标签的基本类型包括图表标题、轴标题、轴标签或比例(显示在图表周围),以及在图表内标记细节的数据标签。度量单位和数据源经常被忽视,但在人们解释您的图表时,它们在消除猜测方面也起着关键作用。请记住,语言是用来帮助的,而不是用来劫持数据的注意力的。

绘制两组数据的图表,一个比例在左边,另一个比例在右边,这可能会让人感到困惑,并暗示了一种可能不存在的关系。

如果所有数据都用相同的度量单位表示,则使用公共水平轴绘制多组数据相对容易,有时也很有帮助。但是如果它们使用不同的单位,您将需要在图表的右侧添加第二个垂直轴。

这种显示需要观众花费时间和精力来解码和理解应该针对哪个轴读取哪些数据。但即使他们解决了这个难题,他们也会忍不住比较两组数据之间的值的大小,斯蒂芬·莱斯说,考虑到数据的规模和单位不同,这是没有意义的。

一般来说,尽量避免在一个很小的空间中挤太多数据。要讲一个详尽的故事,最好用两张或两张以上的图表。

表格对于查找单个数字很有用。但是,为了帮助人们扫描和比较它们,将整数右对齐。

为了让表发挥作用,它必须以一种便于识别数字和行对行比较的方式显示信息。如果我们将数字向左或居中对齐,这就违背了目的,迫使人们在不同的值之间来回跳跃,使得幅度的比较变得困难。

将数字右对齐对于整数值和小数值都适用。对于带有小数位的值,Stephen Low建议将小数点和最后一个数字都靠右对齐。他解释说,“这可以通过使用相同数量的小数位来表示每个值来实现,即使它们是零。”

此外,添加数千个分隔符-如逗号、圆点或空格-将数字分成较小的块,可以帮助人们将值存储在工作内存中,并轻松发现数字之间的差异。

对于图表,越简单越好。为了让事情更清楚,当您有一个或两个值时,只要显示数字即可。

我们经常问自己:我应该使用什么样的图表?大多数数据可视化专家都同意,使用人们熟悉的图形形式总是更好。在大多数情况下,条形、线条、表格或数字是以最少的工作量和空间向世界显示数据的最有效方式。

科尔·努斯鲍默·克纳夫里克强调:“你有一些数字并不意味着你需要一个图表。”当我们试图在图表上只显示一两个数字时,媒介会抢走数据的注意力。直接显示数字要简单得多,而且真正有影响力。