提交 42633aaf 编写于 作者: W wizardforcel

2020-05-07 23:07:15

上级 6402246e
......@@ -14,7 +14,7 @@
![](img/c91410eac85370b279ef79897ecd6319.jpg)
图 13.1:从 2014 年 11 月到 2018 年 4 月,预印本服务器 bioRxiv 的每月提交量。每个点代表一个月内提交的数量。在整个 4.5 年期间,提交量一直在稳步增加。数据来源:Jordan Anaya,[prepubmed.org](http://www.prepubmed.org/)
图 13.1:从 2014 年 11 月到 2018 年 4 月,预印本服务器 bioRxiv 的每月提交量。每个点代表一个月内提交量。在整个 4.5 年期间,提交量一直在稳步增加。数据来源:Jordan Anaya,[prepubmed.org](http://www.prepubmed.org/)
然而,图 13.1 与第 12 章中讨论的散点图之间存在重要差异。在图 13.1 中,点沿着 *x* 轴均匀分布,并且它们之间有一个确定的顺序。每个点只有一个左边和一个右边的邻居(除了最左边和最右边的点,每个点只有一个邻居)。我们可以通过用直线连接相邻点来在视觉上强调这个顺序(图 13.2)。这样的图被称为折线图。
......
......@@ -2,59 +2,59 @@
> 原文: [https://serialmentor.com/dataviz/telling-a-story.html](https://serialmentor.com/dataviz/telling-a-story.html)
大多数数据可视化都是为了通信目的而完成的。我们对数据集有深刻见解,我们有潜在的受众,我们希望向观众传达我们的见解。为了成功传达我们的见解,我们必须向观众展示一个清晰而令人兴奋的故事。对于科学家和工程师来说,对一个故事的需求似乎令他们感到不安,他们可能会把它等同于制造东西,把事情搞得一团糟,或者说超卖结果。然而,这种观点忽略了故事在推理和记忆中所起的重要作用。当我们听到一个好故事时,我们会很兴奋,当故事很糟糕或没有故事时,我们会感到无聊。此外,任何沟通都会在观众心中创造一个故事。如果我们自己不提供一个清晰的故事,那么我们的观众就会提出一个问题。在最佳情况下,他们构成的故事与我们对所呈现材料的看法相当接近。然而,它可能并且往往更糟糕。这个虚构的故事可能是“这很无聊”,“作者错了”或“作者无能”。
大多数数据可视化都是为了沟通目的而完成的。我们对数据集有深刻见解,我们有潜在的观众,我们希望向观众传达我们的见解。为了成功传达我们的见解,我们必须向观众展示一个清晰而令人兴奋的故事。对于科学家和工程师来说,对一个故事的需求似乎令他们感到不安,他们可能会把它等同于制造东西,把事情搞得一团糟,或者说过度吹捧结果。然而,这种观点忽略了故事在推理和记忆中所起的重要作用。当我们听到一个好故事时,我们会很兴奋,当故事很糟糕或没有故事时,我们会感到无聊。此外,任何沟通都会在观众心中创造一个故事。如果我们自己不提供一个清晰的故事,那么我们的观众就会制造一个。在最佳情况下,他们制造的故事与我们对所呈现材料的看法相当接近。然而,它可能并且往往更糟糕。这个虚构的故事可能是“这很无聊”,“作者错了”或“作者无能”。
讲故事的目的应该是运用事实和逻辑推理来吸引观众的兴趣和兴奋。让我告诉你一个关于理论物理学家斯蒂芬霍金的故事。他在 21 岁 - 一年内被诊断出患有运动神经元疾病,并获得了两年的生命。霍金并没有接受这种困境,而是开始将全部精力投入到科学中。霍金最终活到 76 岁,成为他那个时代最有影响力的物理学家之一,并在严重残疾时完成了他所有的开创性工作。我认为这是一个令人信服的故事。它也完全基于事实和真实。
讲故事的目的应该是运用事实和逻辑推理来让观众觉得有趣和兴奋。让我告诉你一个关于理论物理学家斯蒂芬霍金的故事。他在 21 岁 - 一年内被诊断出患有运动神经元疾病,并只剩下了两年的生命。霍金并没有接受这种困境,而是开始将全部精力投入到科学中。霍金最终活到 76 岁,成为他那个时代最有影响力的物理学家之一,并在严重残疾时完成了他所有的开创性工作。我认为这是一个令人信服的故事。它也完全基于事实和现实。
## 29.1 什么是故事?
在我们讨论将可视化转化为故事的策略之前,我们需要了解故事究竟是什么。故事是一组观测值,事实或事件,真实的或发明的,以特定的顺序呈现,以便它们在观众中产生情绪反应。情绪反应是通过故事开始时紧张的积累以及故事结束时的某种类型的解决方式产生的。我们将从张力到分辨率的流程也称为故事绘图,每个好故事都有清晰,可识别的弧度。
在我们讨论将可视化转化为故事的策略之前,我们需要了解故事究竟是什么。故事是一组观测值,事实或事件,真实的或发明的,以特定的顺序呈现,以便它们在观众中产生情绪反应。情绪反应是通过故事开始时的冲突的构建以及故事结束时的某种类型的结局产生的。我们也将从冲突到结局的流程称为故事弧线度,每个好故事都有清晰,可识别的弧度。
经验丰富的作家知道,讲故事的标准模式与人类的思考方式产生共鸣。例如,我们可以使用 Opening-Challenge-Action-Resolution 格式来讲述故事。事实上,这是我在前一小节中用于霍金故事的格式。我通过介绍物理学家斯蒂芬霍金的话题开启了这个故事。接下来,我提出了挑战,21 岁时运动神经元疾病的诊断。然后是行动,他对科学的激烈奉献。最后,我提出了决议,霍金过着漫长而成功的生活,最终成为他那个时代最有影响力的物理学家之一。其他故事格式也是常用的。报纸文章经常遵循 Lead-Development-Resolution 格式,或者甚至更短的,只是 Lead-Development,其中领导者预先给出了主要观点,随后的材料提供了更多细节。如果我们想以这种形式讲述霍金的故事,我们可能会开始用一句话来说,“有影响力的物理学家斯蒂芬霍金,他彻底改变了我们对黑洞和宇宙学的理解,使他的医生的预后超过了 53 年,并做了所有在他严重残疾的情况下,他最有影响力的工作。“这是领先。在发展过程中,我们可以对霍金的生活,疾病和对科学的热爱进行更深入的描述。另一种形式是行动 - 背景 - 发展 - 高潮 - 结束,它比开放 - 挑战 - 行动 - 决议更快地发展故事,但不像铅 - 发展那么快。在这种格式中,我们可能打开一句话,如“年轻的斯蒂芬霍金,面临衰弱的残疾和早逝的前景,决定将他所有的努力投入到他的科学中,决心在他仍然可以的时候留下他的印记。 “这种格式的目的是吸引观众并尽早建立情感联系,但不会立即泄露最终解决方案
经验丰富的作家知道,讲故事的标准模式与人类的思考方式产生共鸣。例如,我们可以使用“开头-挑战-行动-结局”的格式来讲述故事。事实上,这是我在前一小节中用于霍金故事的格式。我通过介绍物理学家斯蒂芬霍金的话题开启了这个故事。接下来,我提出了挑战,21 岁时运动神经元疾病的诊断。然后是行动,他对科学的激烈奉献。最后,我提出了结局,霍金过着漫长而成功的生活,最终成为他那个时代最有影响力的物理学家之一。其他故事格式也是常用的。报纸文章经常遵循“前导-发展-结局”格式,或者甚至更短的,只是“前导-发展”,其中前导部分预先给出了主要观点,随后的材料提供了更多细节。如果我们想以这种形式讲述霍金的故事,我们可能会开始用一句话来说,“有影响力的物理学家斯蒂芬霍金,他彻底改变了我们对黑洞和宇宙学的理解,比他的医生的预言多活了 53 年,并在他严重残疾的情况下,做出了所有最有影响力的工作。”这是前导。在发展阶段中,我们可以对霍金的生活,疾病和对科学的热爱进行更深入的描述。另一种形式是“行动 - 背景 - 发展 - 高潮 - 结束”,它比“开头 - 挑战 - 行动 - 结局”更快地发展故事,但不像“前导 - 发展”那么快。在这种格式中,我们可能以一句话开头,如“年轻的斯蒂芬霍金,面临衰弱的残疾和早逝的前景,决定将他所有的努力投入到他的科学中,决心在他仍然可以的时候留下他的印记。”这种格式的目的是吸引观众并尽早建立情感联系,但不会立即泄露最终结局
我在本章的目标不是更详细地描述这些标准的故事讲述形式。这些材料有很好的资源。对于科学家和分析师,我特别推荐 Schimel( [2011](#ref-Schimel2011) )。相反,我想讨论如何将数据可视化引入故事弧。最重要的是,我们需要意识到单个(静态)可视化很少会讲述整个故事。可视化可以说明开场,挑战,动作或解决方案,但不太可能同时传达故事的所有这些部分。要讲一个完整的故事,我们通常需要多个可视化。例如,在进行演示时,我们可能首先展示一些背景或动机材料,然后是创建挑战的图形,最后是提供分辨率的其他图形。同样,在一篇研究论文中,我们可能会呈现一系列共同创造令人信服的故事绘图的人物。然而,也可以将整个故事弧压缩成单个图形。这样的数字必须同时包含挑战和解决方案,并且它与以导演开头的故事弧相当。
我在本章的目标不是更详细地描述这些标准的故事讲述形式。这些材料有很好的资源。对于科学家和分析师,我特别推荐 Schimel(2011)。相反,我想讨论如何将数据可视化引入故事弧线。最重要的是,我们需要意识到单个(静态)可视化很少会讲述整个故事。可视化可以说明开场,挑战,动作或解决,但不太可能同时传达故事的所有这些部分。要讲一个完整的故事,我们通常需要多个可视化。例如,在进行演示时,我们可能首先展示一些背景或动机材料,然后是创建挑战的图形,最后是提供结局的其他图形。同样,在一篇研究论文中,我们可能会呈现一系列绘图,共同创造令人信服的故事弧线。然而,也可以将整个故事弧线压缩成单个图形。这样的图形必须同时包含挑战和结局,并且它与以导演开头的故事弧线相当。
为了提供一个将数字融入故事的具体例子,我现在将根据两个数字讲述一个故事。第一个是挑战,第二个是分辨率。我的故事背景是生物科学中预印本的增长(另见章节 [13](time-series.html#time-series) )。预印本是草稿形式的手稿,科学家在正式同行评审和官方出版之前与他们的同事分享。只要科学手稿存在,科学家就一直在分享手稿草稿。然而,在 20 世纪 90 年代早期,随着互联网的出现,物理学家意识到在中央存储库中存储和分发稿件草稿要高效得多。他们发明了预印本服务器,这是一个网络服务器,科学家可以上传,下载和搜索稿件草稿。
为了提供一个将图形融入故事的具体例子,我现在将根据两个图形讲述一个故事。第一个创造挑战,第二个用做结局。我的故事背景是生物科学中预印本的增长(另见第 13 章)。预印本是草稿形式的手稿,科学家在正式同行评审和官方出版之前与他们的同事分享它们。只要科学手稿存在,科学家就一直在分享手稿草稿。然而,在 20 世纪 90 年代早期,随着互联网的出现,物理学家意识到在中央存储库中存储和分发手稿草稿要高效得多。他们发明了预印本服务器,这是一个网络服务器,科学家可以上传,下载和搜索手稿草稿。
今天开发并仍在使用的预印本服务器物理学家称为 arXiv.org。成立不久后,arXiv.org 开始拓展并在相关的数量领域受到欢迎,包括数学,天文学,计算机科学,统计学,定量金融和定量生物学。在这里,我对 arXiv.org 的定量生物学(q-bio)部分的预印本提交感兴趣。从 2007 年到 2013 年底,每月提交的数量呈指数增长,但随后增长突然停止(图 29.1 )。 2013 年末必定会发生一些事情,从根本上改变了定量生物学预印本提交的格局。是什么原因导致了提交增长的巨大变化?
由物理学家开发并今天仍在使用的预印本服务器,称为 arXiv.org。成立不久后,arXiv.org 开始拓展并在相关的量化领域受到欢迎,包括数学,天文学,计算机科学,统计学,量化金融和量化生物学。在这里,我对 arXiv.org 的量化生物学(q-bio)部分的预印本提交感兴趣。从 2007 年到 2013 年底,每月提交量呈指数增长,但随后增长突然停止(图 29.1 )。 2013 年末必定会发生一些事情,从根本上改变了量化生物学预印本提交的格局。是什么原因导致了提交增长的巨大变化?
![](img/b8909d71d9aef7c4d3bdd1e13fae904d.jpg)
图 29.1:预印本服务器 arXiv.org 的定量生物学(q-bio)部分每月提交的增长。 2014 年左右可以看到增长率的急剧转变。虽然到 2014 年增长迅速,但从 2014 年到 2018 年几乎没有增长。请注意, *y* 轴是对数的,因此线性增长 *y* 对应于预印本提交中的指数增长。数据来源:Jordan Anaya, [http://www.prepubmed.org/](http://www.prepubmed.org/)
图 29.1:预印本服务器 arXiv.org 的量化生物学(q-bio)部分每月提交量的增长。 2014 年左右可以看到增长率的急剧转变。虽然 2014 年之前增长迅速,但从 2014 年到 2018 年几乎没有增长。请注意, *y* 轴是对数的,因此 *y* 线性增长对应于预印本提交量的指数增长。数据来源:Jordan Anaya,[prepubmed.org](http://www.prepubmed.org/)
我认为 2013 年末标志着预印本在生物学上起飞的时间点,具有讽刺意味的是,这导致 q-bio 档案减缓其增长。 2013 年 11 月,生物特定的预印本服务器 bioRxiv 由冷泉港实验室(CSHL)出版社推出。 CSHL Press 是一家在生物学家中备受推崇的出版商。 CSHL Press 的支持极大地帮助了一般的预印本和 bioRxiv,尤其是生物学家。那些对 arXiv.org 非常怀疑的生物学家对 bioRxiv 更加满意。因此,bioRxiv 迅速获得生物学家的认可,达到了 arXiv 从未管理过的程度。实际上,在其推出后不久,bioRxiv 开始在月度提交中经历快速,指数级增长,并且 q-bio 提交的减缓恰好与 bioRxiv 的这种指数增长的开始一致(图 29.2 )。似乎是许多定量生物学家,否则他们可能已经存放了 q-bio 的预印本决定将其与 bioRxiv 一起存放
我认为 2013 年末标志着预印本在生物学上起飞的时间点,具有讽刺意味的是,这导致 q-bio 归档减缓其增长。 2013 年 11 月,生物特定的预印本服务器 bioRxiv 由冷泉港实验室(CSHL)出版社推出。 CSHL Press 是一家在生物学家中备受推崇的出版商。CSHL Press 的支持极大有助于通用预印本特别是 bioRxiv 在生物学家中的认可。那些对 arXiv.org 非常怀疑的生物学家对 bioRxiv 更加满意。因此,bioRxiv 迅速获得生物学家的认可,达到了 arXiv 从未到达的程度。实际上,在其推出后不久,bioRxiv 的每月提交量开始经历快速的指数级增长,并且 q-bio 提交量的减缓恰好与 bioRxiv 的这种指数增长的开始一致(图 29.2 )。许多量化生物学家可能已经在 q-bio 存放了的预印本,决定将其存放在 bioRxiv
![](img/711a5695823c0313f8ba8a34dbc1ea92.jpg)
图 29.2:提交增长到 q-bio 的平衡与 bioRxiv 服务器的引入相吻合。显示了通用预印本服务器 arxiv.org 的 q-bio 部分和专用生物学预印本服务器 bioRxiv 的月度提交量的增长。 bioRxiv 服务器于 2013 年 11 月投入使用,其提交率自此以来呈指数级增长。似乎许多否则会向 q-bio 提交预印本的科学家选择提交给 bioRxiv。数据来源:Jordan Anaya, [http://www.prepubmed.org/](http://www.prepubmed.org/)
图 29.2: q-bio 的提交量增长的平缓,与 bioRxiv 服务器的引入相吻合。显示了通用预印本服务器 arxiv.org 的 q-bio 部分和生物学专用的预印本服务器 bioRxiv 的月度提交量的增长。 bioRxiv 服务器于 2013 年 11 月投入使用,其提交量自此以来呈指数级增长。似乎许多会向 q-bio 提交预印本的科学家,选择提交给 bioRxiv。数据来源:Jordan Anaya,[www.prepubmed.org](http://www.prepubmed.org/)
这是我关于生物学预印本的故事。我故意用两个数字告诉它,即使第一个(图 29.1 )完全包含在第二个数字中(图 29.2 )。我认为这个故事在分成两部分时影响最大,这就是我在演讲中的表现方式。然而,图 29.2 本身可以用来讲述整个故事,而单人版本可能更适合于观众可能会有短暂注意力的媒介,例如社交媒体发布。
这是我关于生物学预印本的故事。我故意用两个图形讲述它,即使第一个(图 29.1 )完全包含在第二个图形中(图 29.2 )。我认为这个故事在分成两部分时影响最大,这就是我在演讲中的表现方式。然而,图 29.2 本身可以用来讲述整个故事,而单图版本可能更适合于观众可能会有短暂注意力的媒体,例如社交媒体发布。
## 29.2 为将军制作一个数字
## 29.2 为将军制作一个图形
在本章的其余部分,我将讨论制作个人数字和数字集的策略,以帮助您的观众与您的故事联系并在整个故事中保持参与。首先,最重要的是,您需要向观众展示他们真正能够理解的数据。完全有可能遵循我在本书中提供的所有建议,并仍然制作混淆的数字。当这种情况发生时,你可能已经成为两个常见误解的受害者;首先,观众可以看到你的数字并立即推断出你想要的分数;第二,观众可以快速处理复杂的可视化并理解所显示的关键趋势和关系。这些假设都不是真的。我们需要尽一切努力帮助读者理解可视化的含义,并在我们看到的数据中看到相同的模式。这通常意味着更少。尽可能简化您的数字。删除与您的故事相关的所有功能。只有重点才能保留。我将这个概念称为“为将军制作一个人物”。
在本章的其余部分,我将讨论制作单个图形和图形集的策略,以帮助您的观众与您的故事联系,并在整个故事中保持参与。首先,最重要的是,您需要向观众展示他们真正能够理解的数据。遵循我在本书中提供的所有建议,并仍然制作令人混淆的图形,是完全有可能的。当这种情况发生时,你可能已经成为两个常见误解的受害者;首先,观众可以看到你的图形并立即推断出你想要的要点;第二,观众可以快速处理复杂的可视化并理解所显示的关键趋势和关系。这些假设都不是真的。我们需要尽一切努力帮助读者理解可视化的含义,并在我们看到的数据中展示相同的模式。这通常意味着少即是多。尽可能简化您的图形。删除与您的故事不相关的所有特性。只能保留重点。我将这个概念称为“为将军制作一个图形”。
几年来,我负责一项由美国陆军资助的大型研究项目。对于我们的年度进度报告,项目经理指示我不包括很多数据。我所做的任何数字都应该清楚地表明我们的项目是如何取得成功的。项目经理告诉我,一位将军应该能够看到每个数字,并立即看到我们正在做的是如何改进或超过先前的能力。然而,当我参与该项目的同事向我发送年度进展报告的数据时,许多数字都不符合这一标准。这些数字通常过于复杂,标注在令人困惑的技术术语中,或者根本没有明显的要点。大多数科学家没有接受过训练来为将军制作数字
几年来,我负责一项由美国陆军资助的大型研究项目。对于我们的年度进度报告,项目经理指示我排除很多数据。我所做的任何图形都应该清楚地表明我们的项目是如何取得成功的。项目经理告诉我,一位将军应该能够看到每个图形,并立即看到我们正在做的,如何改进或超过先前的能力。然而,当参与该项目的同事向我发送年度进展报告的图形时,许多图形都不符合这一标准。这些图形通常过于复杂,以在令人困惑的技术术语标注,或者根本没有明显的要点。大多数科学家没有接受过训练来为将军制作图形
永远不要假设您的受众可以快速处理复杂的视觉显
> 永远不要假设您的受众可以快速处理复杂的视觉显示。
有些人可能会听到这个故事,并得出结论,将军不是很聪明,或者只是不是科学。我认为这是错误的带回家的消息。将军们非常忙碌。他们不能花 30 分钟试图破译一个神秘的人物。当他们向科学家提供数百万美元的纳税人资金进行基础研究时,他们可以期待的最少的回报是一些明确的证据,证明有价值和有趣的事情已经完成。这个故事也不应该被误解为特别是军事资金。将军是您可能想要通过可视化实现的任何人的隐喻。它可以是您的论文或资助提案的科学评论员,可以是报纸编辑,也可以是您所在公司的主管或主管的老板。如果你想要讲述你的故事,你需要制作适合所有这些将军的数字
有些人可能会听到这个故事,并得出结论,将军不是很聪明,或者只是不科学。我认为这是错误的带回家的消息。将军们非常忙碌。他们不能花 30 分钟试图破译一个神秘的图形。当他们向科学家提供数百万美元的纳税人资金进行基础研究时,他们可以期待的最少的回报,是一些明确的证据,证明有价值和有趣的事情已经完成。这个故事也不应该被误解为仅仅关于军事资金。将军是您可能想要通过可视化实现的任何图形的隐喻。它可以是您的论文或资助提案的科学审稿人,可以是报纸编辑,也可以是您所在公司的主管或主管的老板。如果你想要讲述你的故事,你需要制作适合所有这些将军的图形
具有讽刺意味的是,现代可视化软件使我们能够轻松地制作复杂的数据可视化的第一件事就是为将军制作人物。凭借几乎无限的可视化功能,在更多维度的数据上保持打桩变得很诱人。事实上,我认为数据可视化领域的趋势使最复杂,多方面的可视化成为可能。这些可视化可能看起来非常令人印象深刻,但它们不太可能传达一个清晰的故事。考虑图 29.3 ,其中显示了 2013 年离开纽约市区域的所有航班的到达延误。我怀疑这将需要一段时间来处理这个数字
具有讽刺意味的是,阻碍为将军制作图形的第一件事,就是现代可视化软件使我们能够轻松地制作复杂的数据可视化。凭借几乎无限的可视化功能,在更多维度上钻取数据变得很诱人。事实上,我认为数据可视化领域的趋势使最复杂,多方面的可视化成为可能。这些可视化可能看起来非常令人印象深刻,但它们不太可能传达一个清晰的故事。考虑图 29.3,显示了 2013 年离开纽约市区的所有航班的到达延误。我怀疑这将需要一段时间来处理这个图形
![](img/76dcb192132d60fa59f7f9d3b1afcde0.jpg)
图 29.3:平均到达延迟与距离纽约市的距离。每个点代表一个目的地,每个点的大小代表 2013 年从纽约市三个主要机场(纽瓦克,肯尼迪国际机场或拉瓜迪亚)到该目的地之一的航班数量。负延误意味着航班早到。实线表示到达延迟和距离之间的平均趋势。无论行程距离如何,达美航空的到达延误始终低于其他航空公司。平均而言,美国人在短距离内的延误率最低,但是对于长途旅行的延误来说,这是最大的延迟。这个数字被标记为“坏”,因为它过于复杂。大多数读者会发现它令人困惑,并且不会直观地掌握图中显示的内容。数据来源:美国运输部,交通运输统计局。
图 29.3:平均到达延误与距离纽约市的距离。每个点代表一个目的地,每个点的大小代表 2013 年从纽约市三个主要机场(纽瓦克,肯尼迪国际机场或拉瓜迪亚)之一到该目的地的航班数量。负延误意味着航班早到。实线表示到达延误和距离之间的平均趋势。无论行程距离如何,达美的到达延误始终低于其他航空公司。平均而言,美国航空在短距离内的延误率最低,但是对于长途旅行来说,延误最大。这个图形被标记为“不好”,因为它过于复杂。大多数读者会发现它令人困惑,并且不会直观地掌握图中显示的内容。数据来源:美国运输部,交通运输统计局。
我认为图 29.3 最重要的特征是美国和三角洲的到达时间最短。在简单的条形图中更好地传达了这种见解(图 29.4 )。因此,图 29.4 是正确的数据,以显示该故事是否与航空公司的到达延迟有关,即使该图表不会挑战您的数据可视化技能。如果你当时想知道这些航空公司是否因为他们没有从纽约市那么多飞行而有小延迟,你可以提出第二个条形图,强调美国和三角洲都是纽约市的主要航空公司(图 29.5 )。这两个条形图都丢弃了图 29.3 中显示的距离变量。还行吧。我们不需要可视化与我们的故事相关的数据维度,即使我们拥有它们,即使我们可以制作一个显示它们的数字。简单明了比复杂和混乱更好。
我认为图 29.3 最重要的特征是美国和达美的到达时间最短。在简单的条形图中更好地传达了这种见解(图 29.4)。因此,图 29.4 是正确的图形,显示该故事是否与航空公司的到达延误有关,即使该图表不会挑战您的数据可视化技能。如果你当时想知道,这些航空公司的延误较小,是否因为他们没有飞出纽约市那么长时间,你可以提出第二个条形图,强调美国和达美都是纽约市的主要航空公司(图 29.5)。这两个条形图都丢弃了图 29.3 中显示的距离变量。还行吧。我们不需要可视化与我们的故事无关的数据维度,即使我们拥有它们,即使我们可以制作一个显示它们的图形。简单清晰比复杂混乱更好。
![](img/d37ca061b993739656e2d7196d950189.jpg)
图 29。4:2013 年按航空公司飞往纽约市区的航班的平均到达延误。所有航空公司飞出纽约市区的美国航空和达美航空的平均到达延误率最低。数据来源:美国运输部,交通运输统计局。
图 29.4:2013 年飞往纽约市区的航班的平均到达延误,按航空公司分组。所有飞出纽约市区的航空公司中,美国航空和达美航空的平均到达延误最低。数据来源:美国运输部,交通运输统计局。
![](img/e0fb1245ebc9bb69bf329da515ed48ac.jpg)
图 29.5:2013 年按航空公司飞出纽约市区的航班数量。乘坐飞往纽约市区的航班,达美航空和美国航空是第四和第五大航空公司。数据来源:美国运输部,交通运输统计局。
图 29.5:2013 年飞往纽约市区的航班数量,按航空公司分组。在所有飞出纽约市区的航班中,达美航空和美国航空是第四和第五。数据来源:美国运输部,交通运输统计局。
当您尝试一次显示太多数据时,最终可能无法显示任何内容。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册