提交 ea0ae122 编写于 作者: W wizardforcel

2020-05-08 16:26:12

上级 9c069e64
......@@ -114,37 +114,37 @@
图 16.13:平均巧克力评级的频率论置信区间和贝叶斯可信区间的比较。我们看到两种方法产生相似但不完全相同的结果。特别是,贝叶斯估计显示出少量的收缩,这是最极端的参数估计在整体均值方向上的调整。 (注意瑞士的贝叶斯估计略微向左移动,秘鲁的贝叶斯估计相对于相应的频率估计稍微向右移动。)此处显示的频率估计和置信区间,与图 16.7 所示的 95% 置信的结果相同。
贝叶斯可信区间回答了这样一个问题:“我们在哪里期望真实参数值位于何处?”频率主义置信区间回答了一个问题:“我们对于真实参数值不是零的确定程度如何?”
贝叶斯可信区间回答了这样一个问题:“我们期望真实参数值位于何处?”频率主义置信区间回答了一个问题:“我们对于真实参数值不是零的确定程度如何?”
贝叶斯估计的中心目标是获得后验分布。因此,贝叶斯通常将整个分布可视化,而不是将其简化为可信区间。因此,在数据可视化方面,所有在章节 [7](histograms-density-plots.html#histograms-density-plots)[8](ecdf-qq.html#ecdf-qq)[9](boxplots-violins.html#boxplots-violins) 中讨论的可视化分布的方法都是适用的。具体而言,直方图,密度图,箱线图,小提琴和脊线图都常用于可视化贝叶斯后验分布。由于这些方法已经在他们的具体章节中进行了详细讨论,我将在这里仅展示一个例子,使用山脊图来显示平均巧克力评级的贝叶斯后验分布(图 16.14 )。在这个特定情况下,我在曲线下添加了阴影以指示后验概率的定义区域。作为着色的替代方法,我也可以绘制分位数点图,或者我可以在每个分布下添加渐变误差条。带有误差条的 Ridgeline 图称为半眼,带有误差条的小提琴图称为眼图(章节 5.6 )。
贝叶斯估计的中心目标是获得后验分布。因此,贝叶斯通常将整个分布可视化,而不是将其简化为可信区间。因此,在数据可视化方面,在第七、八、九章中讨论的可视化分布的所有方法都是适用的。具体而言,直方图,密度图,箱线图,提琴图和脊线图都常用于可视化贝叶斯后验分布。由于这些方法已经在他们的具体章节中进行了详细讨论,我将在这里仅展示一个例子,使用脊线图来显示平均巧克力评级的贝叶斯后验分布(图 16.14)。在这个特定情况下,我在曲线下添加了阴影来指示后验概率的定义区域。作为着色的替代方法,我也可以绘制分位数点图,或者我可以在每个分布下添加分级误差条。带有误差条的脊线图称为半眼图,带有误差条的提琴图称为眼图(章节 5.6)。
![](img/5e96433ec5420eb315a2e96ba26f8bd6.jpg)
图 16.14:平均巧克力棒评级的贝叶斯后验分布,显示为山脊线图。红点代表每个后验分布的中位数。由于难以通过眼睛将连续分布转换为特定置信区域,因此我在每条曲线下添加了阴影以指示每个后验分布的中心 80%,95%和 99%
图 16.14:平均巧克力棒评级的贝叶斯后验分布,显示为脊线图。红点代表每个后验分布的中位数。由于难以通过眼睛将连续分布转换为特定置信区域,因此我在每条曲线下添加了阴影来指示每个后验分布的中心 80%,95% 和 99%
## 16.3 可视化曲线拟合的不确定性
在第 [14](visualizing-trends.html#visualizing-trends) 章节中,我们讨论了如何通过将直线或曲线拟合到数据来显示数据集中的趋势。这些趋势估计也存在不确定性,并且习惯上在具有置信区间的趋势线中显示不确定性(图 16.15 )。置信区为我们提供了一系列与数据兼容的不同拟合线。当学生第一次遇到一个置信区时,他们常常会惊讶地发现,即使是完美的直线拟合也会产生一个弯曲的置信带。曲率的原因是直线拟合可以在两个不同的方向上移动:它可以上下移动(即,具有不同的互连),并且它可以旋转(即,具有不同的斜率)。我们可以通过绘制从拟合参数的后验分布随机生成的一组替代拟合线来可视地显示置信带是如何产生的。这在图 16.16 中完成,其显示了 15 个随机选择的替代拟合。我们看到,即使每条线都是完全笔直的,每条线的不同斜率和截距的组合也会产生一个整体形状,看起来就像置信区一样。
在第 14 章中,我们讨论了如何通过将直线或曲线拟合到数据,来显示数据集中的趋势。这些趋势估计也存在不确定性,并且习惯上在具有置信区间的趋势线中显示不确定性(图 16.15)。置信区间为我们提供了一系列与数据兼容的不同拟合线。当学生第一次遇到一个置信区间时,他们常常会惊讶地发现,即使是完美的直线拟合也会产生一个弯曲的置信带。弯曲的原因是直线拟合可以在两个不同的方向上移动:它可以上下移动(即,具有不同的截距),并且它可以旋转(即,具有不同的斜率)。我们可以通过绘制从拟合参数的后验分布随机生成的一组替代拟合线,来可视地显示置信带是如何产生的。这在图 16.16 中完成,它显示了 15 个随机选择的替代拟合。我们看到,即使每条线都是完全笔直的,每条线的不同斜率和截距的组合也会产生一个整体形状,看起来就像置信区间一样。
![](img/a82b642c17a97945fa144ca371763463.jpg)
图 16.15:雄性蓝鸟的头长与体重的关系,如图 14.7 所示。直蓝线代表数据的最佳线性拟合,线周围的灰色条带显示线性拟合的不确定性。灰色条带代表 95%的置信水平。数据来源:欧柏林学院的 Keith Tarvin
图 16.15:雄性蓝鸟的头长与体重的关系,如图 14.7 所示。蓝色直线代表数据的最佳线性拟合,线周围的灰色条带显示线性拟合的不确定性。灰色条带代表 95% 的置信水平。数据来源:欧柏林学院的 Keith Tarvin
![](img/7b7a288e14ad2ea516507ec18548be5c.jpg)
图 16.16:雄性蓝鸟的头长与体重的关系。与图 16.15 相比,直蓝线现在代表从后验分布中随机抽取的同样可能的替代拟合。数据来源:欧柏林学院的 Keith Tarvin
图 16.16:雄性蓝鸟的头长与体重的关系。与图 16.15 相比,蓝色直线现在代表从后验分布中随机抽取的等可能的替代拟合。数据来源:欧柏林学院的 Keith Tarvin
为了绘制置信带,我们需要指定置信水平,正如我们在误差条和后验概率中看到的那样,突出不同的置信水平会很有用。这导致我们进入分级置信区间,一次显示几个置信水平(图 16.17 )。分级置信带增强了读者的不确定感,并迫使读者面对数据可能支持不同替代趋势线的可能性。
![](img/41d547a89b0984331b4979f03796c144.jpg)
图 16.17:雄性蓝鸟的头长与体重的关系。与误差条的情况一样,我们可以绘制分级置信带突出估计中的不确定性。数据来源:欧柏林学院的 Keith Tarvin
图 16.17:雄性蓝鸟的头长与体重的关系。与误差条的情况一样,我们可以绘制分级置信带,来突出估计中的不确定性。数据来源:欧柏林学院的 Keith Tarvin
我们还可以绘制非线性曲线拟合的置信区间。这样的置信区间看起来不错,但很难解释(图 16.18 )。如果我们看一下图 16.18 a,我们可能会认为通过向上和向下移动蓝线并可能稍微变形来产生置信带。然而,如图 16.18 b 所揭示的,置信带表示一系列曲线,它们比(a)部分所示的整体最佳拟合更加晃动。这是非线性曲线拟合的一般原理。不确定性不仅对应于曲线的上下运动,还对应于增加的摆动。
我们还可以绘制非线性曲线拟合的置信区间。这样的置信区间看起来不错,但很难解释(图 16.18 )。如果我们看一下图 16.18a,我们可能会认为,通过向上和向下移动蓝线并可能稍微变形来产生置信带。然而,如图 16.18b 所揭示的,置信带表示一系列曲线,它们比部分(a)所示的整体最佳拟合摆动更大。这是非线性曲线拟合的一般原理。不确定性不仅对应于曲线的上下运动,还对应于增加的摆动。
![](img/f3878e9124ea6ea3f4fe1a0ef220f4de.jpg)
图 16.18:32 辆汽车(1973-74 型号)的燃油效率与排量的关系。每个点代表一辆汽车,通过拟合 5 节的立方回归样条获得平滑线。 (a)最佳拟合样条和置信带。 (b)同样可能从后验分布中得出替代拟合。数据来源:Motor Trend,1974。
图 16.18:32 辆汽车(1973-74 型号)的燃油效率与排量的关系。每个点代表一辆汽车,通过拟合 5 节的立方回归样条获得平滑线。 (a)最佳拟合样条和置信带。 (b)从后验分布中得出的等可能的替代拟合。数据来源:Motor Trend,1974。
## 16.4 假设结果图
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册