提交 cade4c7e 编写于 作者: W wizardforcel

2020-04-23 21:58:49

上级 d652aca2
......@@ -74,31 +74,31 @@
图 16.7:来自六个不同国家的制造商的巧克力棒的平均巧克力风味评级和相关置信区间。数据来源:曼哈顿巧克力学会 Brady Brelinski
在查看图 16.7 时,您可能想知道它告诉我们平均评级的差异。加拿大,瑞士和奥地利条形的平均评级高于美国条形的平均评级,但考虑到这些平均评级的不确定性,平均值 _ 显着 _ 的差异?这里的“重要”一词是统计学家使用的技术术语。如果有一定程度的置信度我们可以拒绝观察到的差异是由随机抽样引起的假设,我们称差异显着。由于只对有限数量的加拿大和美国条形进行了评级,评估者可能会意外地考虑更多更好的加拿大条形和更少的美国条形,而这种随机机会可能看起来像加拿大对美国条形的系统评级优势。
在查看图 16.7 时,您可能想知道,它告诉我们关于平均评级的差异的什么事情。加拿大,瑞士和奥地利的平均评级高于美国的平均评级,但考虑到这些平均评级的不确定性,平均值有显着差异吗?这里的“显着”一词是统计学家使用的技术术语。如果我们有一定程度的置信度,可以拒绝观察到的差异是由随机抽样引起的假设,我们称差异显着。由于仅仅有限数量的加拿大和美国巧克力棒得到了评级,评估者可能会意外地考虑更多更好的加拿大巧克力棒和更少更好的美国巧克力棒,而这种随机几率可能像是加拿大对美国巧克力棒的系统评级优势。
评估图 16.7 的重要性是困难的,因为加拿大平均评级和美国平均评级都有不确定性。两种不确定性都与手段是否不同有关。统计教科书和在线教程有时会发布如何根据误差条重叠或不重叠的程度来判断重要性的经验法则。但是,这些经验法则不可靠,应该避免。评估平均评分是否存在差异的正确方法是计算差异的置信区间。如果这些置信区间不包括零,那么我们知道在相应的置信水平上差异是显着的。对于巧克力评级数据集,我们看到只有来自加拿大的条形的评级明显高于美国的条形(图 16.8 )。对于来自瑞士的条形,差异的 95%置信区间几乎不包括零值。因此,美国和瑞士巧克力棒的平均评级之间的差异在 5%水平上几乎不显着。最后,根本没有证据表明奥地利条形的平均评级系统高于美国的标准
评估图 16.7 的显著性是困难的,因为加拿大平均评级和美国平均评级都有不确定性。两个不确定性都对均值是否不同很重要。统计教科书和在线教程有时会发布,如何根据误差条重叠或不重叠的程度来判断重要性的经验法则。但是,这些经验法则不可靠,应该避免。评估平均评级是否存在差异的正确方法是计算差异的置信区间。如果这些置信区间不包括零,那么我们知道在相应的置信水平上差异是显着的。对于巧克力评级数据集,我们看到只有来自加拿大巧克力棒的评级明显高于美国(图 16.8)。对于瑞士的巧克力棒,差异的 95% 置信区间几乎不包括零值。因此,美国和瑞士巧克力棒的平均评级之间的差异在 5% 水平上几乎不显着。最后,根本没有证据表明奥地利巧克力棒的平均评级系统高于美国
![](img/69e442f68ad284de8076e208dbacf0cb.jpg)
图 16.8:来自五个不同国家的制造商的平均巧克力风味评级,相对于美国巧克力棒的平均评级。加拿大巧克力棒的评级明显高于美国棒。对于其他四个国家,在 95%置信水平下,对美国的平均评级没有显着差异。使用 Dunnett 方法对多重比较调整了置信水平。数据来源:曼哈顿巧克力学会 Brady Brelinski
图 16.8:来自五个不同国家的制造商的平均巧克力风味评级,相对于美国巧克力棒的平均评级。加拿大巧克力棒的评级明显高于美国。对于其他四个国家,在 95% 置信水平下,与美国的平均评级没有显着差异。使用 Dunnett 方法对多个比较调整了置信水平。数据来源:曼哈顿巧克力学会 Brady Brelinski
在前面的图中,我使用了两种不同类型的误差条,分级和简单。更多变化是可能的。例如,我们可以在末尾绘制带或不带上限的误差条(图 16.9 a,c 对比图 16.9 b,d)。所有这些选择都有优点和缺点。渐变误差条突出显示对应于不同置信水平的不同范围的存在。然而,这些附加信息的另一面是增加了视觉噪声。根据图形的复杂程度和信息密集程度,简单的误差条可能优于分级条形图。是否绘制带有或不带帽的误差条主要是个人品味的问题。一个上限突出显示一个错误栏的结束位置(图 16.9 a,c),而没有上限的错误栏同样强调整个区间范围(图 16.9 b, d)。此外,再次,帽增加了视觉噪声,因此在具有许多误差条的图中省略帽可能是优选的。
在前面的图中,我使用了两种不同类型的误差条,分级和简单。更多变体是可能的。例如,我们可以在末尾绘制带或不带帽子的误差条(图 16.9a,c 对比图 16.9b,d)。所有这些选择都有优点和缺点。分级误差条突出显示对应于不同置信水平的不同区间的存在。然而,这些附加信息的另一面是增加了视觉噪声。根据图形的复杂程度和信息密集程度,简单的误差条可能优于分级条形图。是否绘制带有或不带帽子的误差条主要是个人品味的问题。帽子突出显示误差条的结束位置(图 16.9 a,c),而没有帽子的误差条同样强调整个区间范围(图 16.9b, d)。此外,再次,帽子增加了视觉噪声,因此在具有许多误差条的图中省略帽子可能是优选的。
![](img/90e58c814edf53c1e255f80ffac5a873.jpg)
图 16.9:来自四个不同国家的制造商的平均巧克力风味评级,相对于美国巧克力棒的平均评级。每个小组使用不同的方法来可视化相同的不确定性信息。 (a)带帽的分级误差条。 (b)没有上限的分级误差条。 (c)带帽的单间隔误差条。 (d)无间隙的单间隔误差条。 (e)信任条。 (f)信任分配
图 16.9:来自四个不同国家的制造商的平均巧克力风味评级,相对于美国巧克力棒的平均评级。每个面板使用不同的方法来可视化相同的不确定性信息。 (a)带帽子的分级误差条。 (b)没有帽子的分级误差条。 (c)带帽子的单区间误差条。 (d)无帽子的单区间误差条。 (e)置信带。 (f)置信分布
作为误差条的替代方案,我们可以绘制逐渐消失的信心条(图 16.9 e)。信心条更好地传达了可能的不同价值,但它们很难阅读。我们必须在视觉上整合不同的颜色阴影,以确定特定置信度结束的位置。从图 16.9 中我们可以得出结论,秘鲁巧克力棒的平均评级明显低于美国巧克力棒,但事实并非如此。当我们显示明确的置信度分布时会出现类似的问题(图 16.9 f)。很难在视觉上整合曲线下面积并确定达到给定置信水平的确切位置。然而,通过绘制分位数点图可以稍微减轻这个问题,如图 16.3
作为误差条的替代方案,我们可以绘制逐渐消失的置信带(图 16.9 e)。置信带更好地传达了不同值的可能性,但它们很难阅读。我们必须在视觉上整合不同的颜色阴影,来确定特定置信度结束的位置。从图 16.9 中我们可以得出结论,秘鲁巧克力棒的平均评级明显低于美国巧克力棒,但事实并非如此。当我们显示明确的置信度分布时会出现类似的问题(图 16.9 f)。很难在视觉上整合曲线下面积,并确定给定置信水平的确切位置。然而,通过绘制分位数点图可以稍微减轻这个问题,如图 16.3
对于简单的二维图形,误差条比更复杂的不确定性显示具有一个重要优势:它们可以与许多其他类型的图形组合。对于我们可能具有的几乎任何可视化,我们可以通过添加误差条来添加一些不确定性指示。例如,我们可以通过绘制带有误差条的条形图来显示具有不确定性的金额(图 16.10 )。这种类型的可视化通常用于科学出版物中。我们还可以在散点图中沿 *x**y* 方向绘制误差条(图 16.11 )。
对于简单的二维图形,误差条比更复杂的不确定性显示具有一个重要优势:它们可以与许多其他类型的图形组合。对于我们可能具有的几乎任何可视化,我们可以通过添加误差条来添加一些不确定性指示。例如,我们可以通过绘制带有误差条的条形图,来显示具有不确定性的数量(图 16.10)。这种类型的可视化通常用于科学出版物中。我们还可以在散点图中沿 *x**y* 方向绘制误差条(图 16.11)。
![](img/9fb0225750bcc6dbd25c8c5b8cf4b107.jpg)
图 16.10:四个牛品种牛奶中的平均乳脂含量。误差条表示平均值的+/-一个标准误差。这种可视化在科学文献中经常出现。虽然它们在技术上是正确的,但它们既不代表每个类别的变化,也不代表样本的不确定性特别好。有关个体品种内乳脂含量的变化,请参见图 7.11 。数据来源:加拿大纯种奶牛的性能记录
图 16.10:四个品种的牛的牛奶中的平均乳脂含量。误差条表示平均值加减一个标准误差。这种可视化在科学文献中经常出现。虽然它们在技术上是正确的,但它们既不很好地代表每个类别中的变化,也不代表样本的不确定性。有关单个品种中乳脂含量的变化,请参见图 7.11。数据来源:加拿大纯种奶牛的表现记录
![](img/c09cae468f608d7f8c2bd71500b7c36f.jpg)
图 16。11:宾夕法尼亚州 67 个县的中位数收入与中位年龄。误差条表示 90%置信区间。数据来源:2015 年五年美国社区调查
图 16。11:宾夕法尼亚州 67 个县的收入中位数与年龄中位数。误差条表示 90% 置信区间。数据来源:2015 年美国五年社区调查
让我们回到频率论者和贝叶斯主义者的话题。频繁人员用置信区间评估不确定性,而贝叶斯学家计算 _ 后验分布 _ 和 _ 可信区间。_ 贝叶斯后验分布告诉我们给出输入数据的特定参数估计的可能性。可信区间表示一个值范围,其中参数值以给定概率预期,如从后验分布计算的。例如,95%的可信区间对应于后验分布的中心 95%。真实参数值有 95%的可能性处于 95%可信区间。
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册