提交 0d28c6b2 编写于 作者: W wizardforcel

2020-04-26 11:53:16

上级 f9b8bf97
......@@ -58,7 +58,7 @@
## 18.3 等值线
我们还可以估绘图区域内的点密度,并用等值线指示不同点密度的区域,而不是将数据点分组为矩形或六边形。当点密度在 *x**y* 维度上缓慢变化时,该技术很有效。
我们还可以估绘图区域内的点密度,并用等值线指示不同点密度的区域,而不是将数据点分组为矩形或六边形。当点密度在 *x**y* 维度上缓慢变化时,该技术很有效。
作为这种方法的一个例子,我们返回第 12 章节的蓝鸟数据集。图 12.1 显示了 123 只蓝鸟的头长和体重之间的关系,并且这些点之间存在一些重叠。我们可以通过使点更小和部分透明,来更清楚地突出点的分布,并将它们绘制在等值线之上(图 18.8 ),它描绘点密度相似的区域。我们可以通过对由等值线包围的区域进行着色,来进一步增强对点密度变化的感知,对于表示较高点密度的区域使用较暗的颜色(图 18.9 )。
......
# 20 冗余编码
> 原文: [https://serialmentor.com/dataviz/redundant-coding.html](https://serialmentor.com/dataviz/redundant-coding.html)
> 原文: [20 Redundant coding](https://serialmentor.com/dataviz/redundant-coding.html)
> 校验:[飞龙](https://github.com/wizardforcel)
> 自豪地采用[谷歌翻译](https://translate.google.cn/)
在第 19 章中,我们已经看到颜色不能总是像我们希望的那样有效地传达信息。如果我们想要识别许多不同的项目,那么通过颜色这样做可能不起作用。将绘图中的颜色与图例中的颜色相匹配将很困难(图 19.1 )。即使我们只需要区分两到三个不同的项目,如果彩色项目非常小(图 19.11 )颜色可能会失效,并且/或者对于颜色视觉缺陷的人,颜色看起来相似(图 19.7 和 19.8 )。所有这些场景中的一般解决方案是使用颜色来增强图形的视觉外观,而不依赖于颜色来传达关键信息。我将这个设计原理称为冗余编码,因为它提示我们,使用多个不同的美学维度对数据进行冗余编码。
......@@ -54,34 +58,34 @@
尽管通过冗余编码数据可以提高图例的易读性,但是在多种美学中,图例总是给读者带来额外的精神负担。在阅读图例时,读者需要在可视化的一部分中获取信息,然后将其转移到不同的部分。如果我们完全消除这个图例,我们通常可以让读者更轻松。然而,消除图例并不意味着我们根本不提供一个图例,并在图标题中写出诸如“黄点代表杂色鸢尾”的句子。消除图例意味着我们以这样的方式设计图形,即使没有明确的图例,各种图形元素所代表的内容也是不言自明的。
我们可以采用的一般策略称为 _ 直接标记 _,我们将适当的文本标签或其他视觉元素放置在图的其余部分作为指导。我们之前在章 [19](color-pitfalls.html#color-pitfalls) (图 19.2 )中遇到了直接标记,作为绘制具有 50 多种不同颜色的图例的替代方法。为了将直接标签概念应用于股票价格数字,我们将每个公司的名称放在其各自数据行末尾的旁边(图 20.8 )。
我们可以采用的一般策略称为直接标记,我们将适当的文本标签或其他视觉元素放置在图的其余部分作为指导。我们之前在第 19 章(图 19.2 )中遇到了直接标记,作为绘制具有 50 多种不同颜色的图例的替代方法。为了将直接标记概念应用于股票价格图表,我们将每个公司的名称放在其各自数据线末尾的旁边(图 20.8 )。
![](img/84e4b8c9d79f48386a788e3be7bb17be.jpg)
图 20.8:四家主要科技公司的股价随时间变化。 2012 年 6 月,每家公司的股票价格已经标准化为 100。数据来源:雅虎财经
图 20.8:四家主要科技公司的股价随时间变化。 2012 年 6 月,每家公司的股票价格已经标准化为 100。数据来源:雅虎财经
只要有可能,设计您的数字,使他们不需要传奇
只要有可能,设计您的图表,使他们不需要图例
我们也可以从本章开始就将直接标记概念应用于鸢尾花数据,特别是图 20.3 。因为它是分成三个不同组的许多点的散点图,所以我们需要直接标记组而不是单个点。一种解决方案是绘制包围大部分点的椭圆,然后标记椭圆(图 20.9 )。
![](img/2aa1af320ab84d16b0bd8e25a406bdc7.jpg)
图 20.9:三种不同鸢尾花物种的萼片宽度与萼片长度的关系。我已从此图中删除了背景网格,因为否则图形变得太忙了。
图 20.9:三个不同鸢尾花物种的萼片宽度与萼片长度的关系。我已从此图中删除了背景网格,因为否则图形变得太嘈杂了。
对于密度图,我们可以类似地直接标记曲线而不是提供颜色编码的图例(图 20.10 )。在图 20.9 和 20.10 中,我将文本标签着色为与数据相同的颜色。彩颜色刻度签可以大大增强直接标签效果,但它们也可能变得很差。如果文本标签的打印颜色太浅,则标签变得难以阅读。并且,由于文本由非常细的线组成,因此彩色文本通常看起来比相同颜色的相邻填充区域更亮。我通常通过使用每种颜色的两种不同色调来避开这些问题,对于填充区域使用浅色,对于线条,轮廓和文本使用深色。如果仔细检查图 20.9 或 20.10 ,您将看到每个数据点或阴影区域如何填充浅色并且具有以相同色调的深色绘制的轮廓。文本标签以相同的深色绘制。
对于密度图,我们可以类似地直接标记曲线而不是提供颜色编码的图例(图 20.10 )。在图 20.9 和 20.10 中,我将文本标签着色为与数据相同的颜色。彩色标签可以大大增强直接标记的效果,但它们也可能变得很差。如果文本标签以太浅的颜色打印,则标签变得难以阅读。并且,由于文本由非常细的线组成,因此彩色文本通常看起来比相同颜色的相邻填充区域更亮。我通常通过使用每种颜色的两种不同色调来避开这些问题,对于填充区域使用浅色,对于线条,轮廓和文本使用深色。如果仔细检查图 20.9 或 20.10 ,您将看到每个数据点或阴影区域如何填充为浅色,并且轮廓以相同色调的深色绘制。同时,文本标签以相同的深色绘制。
![](img/a7e62626501a392d0528e3d323f81325.jpg)
图 20.10:三不同鸢尾花物种萼片长度的密度估计值。每个密度估计值直接用相应的物种名称标记。
图 20.10:三不同鸢尾花物种萼片长度的密度估计值。每个密度估计值直接用相应的物种名称标记。
我们还可以使用密度图(例如图 20.10 中的密度图作为图例替换,将密度图放入散点图的边缘(图 20.11 )。这允许我们直接标记边缘密度图而不是中心散点图,因此得到的图形比具有直接标记椭圆的图 20.9 稍微杂乱一些。
我们还可以使用密度图(例如图 20.10 作为图例的替代方案,通过将密度图放入散点图的边缘(图 20.11 )。这允许我们直接标记边缘密度图而不是中心散点图,因此得到的图形比具有直接标记椭圆的图 20.9 稍微杂乱一些。
![](img/8210b74a9a6b473c4fe9e4c5e39c185a.jpg)
图 20.11:三种不同鸢尾花物种的萼片宽度与萼片长度的关系,每种物种的每个变量的边缘密度估计值。
图 20.11:三个不同鸢尾花物种的萼片宽度与萼片长度的关系,带有每个物种的每个变量的边缘密度估计值。
最后,每当我们在多个美学中编码单个变量时,我们通常不需要多个单独的图例来表示不同的美学。相反,应该只有一个类似图例的视觉元素一次传达所有映射。在我们将相同变量映射到沿主轴和颜色的位置的情况下,这意味着参考颜色条应该沿着并且被集成到同一轴中。图 20.12 显示的情况是我们将温度映射到沿 *x* 轴的位置和颜色,我们因此将颜色图例整合到 *x* 中]轴
最后,每当我们在多个美学中编码单个变量时,我们通常不需要多个单独的图例来表示不同的美学。相反,应该只有一个类似图例的视觉元素,一次传达所有映射。在我们将相同变量映射到沿主轴的位置和颜色的情况下,这意味着参考颜色条应该沿着并且被集成到同一轴中。图 20.12 显示的情况是,我们将温度映射到沿 *x* 轴的位置和颜色,我们因此将颜色图例整合到 *x* 轴中
![](img/9144d3fdda940c8c38ee794cad5b394e.jpg)
图 20.12:2016 年内布拉斯加州林肯市的气温。该图是图 9.9 的变化。现在通过沿 *x* 轴的位置和颜色显示温度,沿 *x* 轴的颜色条显示将温度转换为颜色的刻度。
\ No newline at end of file
图 20.12:2016 年内布拉斯加州林肯市的气温。该图是图 9.9 的变体。现在通过沿 *x* 轴的位置和颜色显示温度,沿 *x* 轴的颜色条显示将温度转换为颜色的刻度。
\ No newline at end of file
......@@ -22,7 +22,7 @@
我在图标题中看到的最常见的错误之一是遗漏了一个正确的数字标题作为标题的第一个元素。回顾图 22.1 的标题。它以“腐败和人类发展”开头。_ 并没有 _ 开头“这个图显示了腐败与人类发展的关系。”标题的第一部分始终是标题,而不是对该图的内容。标题不一定是完整的句子,尽管做出明确断言的短句可以作为标题。例如,对于图 22.1 ,诸如“最发达国家是最不腐败的”这样的标题就可以正常工作。
## 22.2 轴和传奇头衔
## 22.2 轴和图例头衔
就像每个绘图都需要一个标题,轴和传说也需要标题。 (轴标题通常通俗地称为 _ 轴标签 _。)轴和图例标题和标签说明了显示的数据值以及它们如何映射到绘图美学。
......
......@@ -38,7 +38,7 @@
![](img/a3e525a9682ffe2d8a33b0d18cc87cd6.jpg)
图 4.4:德克萨斯州的年收入中位数。德克萨斯州主要城市地区的收入中位数最高,特别是在休斯顿和达拉斯附近。西德克萨斯州的 Loving 县没有收入中位数估值,因此该县显示为灰色。数据来源:2015 年的美国五年社区调查
图 4.4:德克萨斯州的年收入中位数。德克萨斯州主要城市地区的收入中位数最高,特别是在休斯顿和达拉斯附近。西德克萨斯州的 Loving 县没有收入中位数估值,因此该县显示为灰色。数据来源:2015 年的美国五年社区调查
在某些情况下,我们需要将数据值的偏差可视化为相对于中性点的两个方向之一。一个简单的例子是包含正数和负数的数据集。我们可能想要使用不同颜色来显示它们,这样就可以立即看出一个值是正还是负,以及它在任何一个方向上到零的距离。在这种情况下,适当的颜色刻度是发散颜色刻度。我们可以将一个不同的刻度视为两个连续的刻度,它们在一个共同的中点处拼接在一起,通常用浅色来表示(图 4.5 )。发散刻度需要平衡,以便从中心的浅色到外侧的深色的渐变,在任一方向上大致相同。否则,数据值的感知幅度将取决于它是否高于或低于中点值。
......
......@@ -66,7 +66,7 @@
![](img/1b88da76c2f13bb37e9af485ec4c5a21.jpg)
误差条表示某些估计或测量的可能值的范围。它们从表示估或测量的某个参考点水平和/或垂直延伸(第 16 章)。参考点可以以各种方式显示,例如通过点或条形。渐变误差条同时显示多个范围,其中每个范围对应于不同的置信度。它们实际上是多个误差条,其中不同的线厚度彼此叠加。
误差条表示某些估计或测量的可能值的范围。它们从表示估或测量的某个参考点水平和/或垂直延伸(第 16 章)。参考点可以以各种方式显示,例如通过点或条形。渐变误差条同时显示多个范围,其中每个范围对应于不同的置信度。它们实际上是多个误差条,其中不同的线厚度彼此叠加。
![](img/48666ed2ad9505bf8c7f56b75666547a.jpg)
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册