未验证 提交 6226d822 编写于 作者: 布客飞龙 提交者: GitHub

Merge pull request #10 from liuyixi520/master

update 15.md-18.md
此差异已折叠。
此差异已折叠。
......@@ -2,29 +2,28 @@
# 17 实用统计建模
在这一章中,我们将把我们所学的知识运用到一个实际的例子中。2007 年,Christopher Gardner 和来自 Stanford 的同事在美国医学协会杂志上发表了一项名为“Atkins,Zone,Ornish 和 LEARN 饮食对绝经前超重妇女体重变化和相关风险因素的比较——A 到 Z 减肥研究:随机试验”的研究 ( [Gardner 等人,2007 年](ch020.xhtml#ref-gard:kiaz:alha:2007) ) 。我们将通过这项研究来展示如何从头到尾分析一个实验数据集。
在这一章中,让我们将所学的知识运用到一个实际的例子中。2007 年,斯坦福大学的克里斯托弗·加德纳 (Christopher Gardner) 及其同事在 * 美国医学协会杂志 * 上发表了一项研究,题为“Atkins, Zone, Ornish, LEARN四种饮食对超重绝经前女性体重变化和相关风险因素的比较—— A TO Z 减肥研究:随机试验”[@gard:kiaz:alha:2007]。 我们将使用这项研究来展示一个端到端的数据分析过程。
## 17.1 统计建模的过程
当我们想要使用我们的统计模型来检验一个科学假设时,我们通常会经历一系列步骤:
当我们想要使用我们的统计模型来检验一个科学假设时,我们通常会经历以下步骤:
1. 请具体说明您感兴趣的问题
1. 明确问题
2. 识别或收集适当的数据
3. 为分析准备数据
4. 确定合适的型号
3. 为分析工作准备相应的数据
4. 确定合适的模型
5. 使模型符合数据
6. 批评模型以确保它合适
6. 惩罚模型以确保它拟合数据
7. 测试假设并量化影响大小
### 17.1.1 1:说明您感兴趣的问题
### 17.1.1 1:明确问题
根据作者的说法,他们研究的目标是:
> 比较代表从低到高碳水化合物摄入范围的 4 种减肥食谱对减肥和相关代谢变量的影响。
> 比较代表4种从低到高碳水化合物摄入对减肥和相关代谢变量的影响。
......@@ -32,7 +31,7 @@
### 17.1.2 2:识别或收集适当的数据
为了回答他们的问题,研究人员将 311 名超重/肥胖女性随机分配到四种不同饮食中的一种(阿特金斯、Zone、Ornish 或 LEARN),并随着时间的推移测量她们的体重和许多其他健康指标。作者记录了大量的变量,但对于感兴趣的主要问题,让我们专注于一个变量:身体质量指数(身体质量指数)。此外,由于我们的目标是测量身体质量指数的持久变化,我们将只关注饮食开始后 12 个月的测量。
为了回答他们的问题,研究人员将311名超重/肥胖女性随机分配到四种不同饮食中的一种(Atkins、Zone、Ornish、LEARN),并随着时间的推移测量她们的体重和许多其他健康指标。作者记录了大量的变量,但对于感兴趣的主要问题,让我们专注于一个变量:身体质量指数(体脂比)。此外,由于我们的目标是测量身体质量指数的持久变化,我们将只关注饮食开始后 12 个月的测量。
......@@ -44,15 +43,15 @@
图 17.1:每种情况下的箱线图,第 50 个百分位数(即中位数)显示为每组的黑线。
A 到 Z 研究的实际数据是不公开的,所以我们将使用他们论文中报告的汇总数据来生成一些合成数据,这些数据大致与他们研究中获得的数据相匹配,每组的均值和标准差都相同。一旦我们有了数据,我们可以将它们可视化,以确保没有异常值。箱线图有助于观察分布的形状,如图 [17.1](#fig:AtoZBMIChangeDensity) 所示。这些数据看起来相当合理——在单个组中有几个异常值(由方框图外的点表示),但对于其他组来说,它们似乎并不极端。我们还可以看到,这些分布的方差似乎有点不同,阿特金斯比其他人显示出更大的可变性。这意味着任何假设组间方差相等的分析都可能是不合适的。幸运的是,我们计划使用的方差分析模型对此相当稳健。
A到Z研究的实际数据是不公开的,所以我们将使用他们论文报告中的汇总数据来模拟一些合成数据,这些数据与他们研究中的数据差不多,每组的均值和标准差都相同。一旦我们有了数据,我们可以将它们可视化,以确保没有异常值。箱线图有助于观察分布的形状,如图 [17.1](#fig:AtoZBMIChangeDensity) 所示。这些数据看起来相当合理——在每个组中有几个异常值(由方框图外的点表示),但对于其他组来说,异常值并不多。我们还可以看到,这些分布的方差似乎有点不同,Atkins比其他组显示出更大的可变性。这意味着任何假设组间方差相等的分析都可能是不合适的。幸运的是,我们计划使用的方差分析模型对此相当稳健。
### 17.1.4 4。确定合适的型号
### 17.1.4 4。确定合适的模型
为了给我们的分析确定合适的统计模型,我们需要问几个问题。
为了选择合适的统计模型,我们需要问几个问题。
* 什么样的因变量?
* 身体质量指数:连续,大致正态分布
......@@ -70,12 +69,15 @@
### 17.1.5 5。使模型符合数据
让我们对身体质量指数变化进行方差分析,以比较这四种饮食。大多数统计软件会自动将一个名义变量转换成一组虚拟变量。指定统计模型的一种常见方式是使用*公式符号*,其中使用以下形式的公式指定模型:
$$
\text{dependent variable} \sim \text{independent variables}
$$
<math display="block"><semantics><mrow><mtext mathvariant="normal">因变量</mtext><mo></mo><mtext mathvariant="normal">自变量</mtext></mrow><annotation encoding="application/x-tex">\ text {因变量} \ sim \ text {自变量}</annotation></semantics></math>
在这种情况下,我们希望将身体质量指数的变化(存储在名为 *BMIChange12Months* 的变量中)视为饮食(存储在名为*diet 的变量中)的函数,因此我们使用公式:
在这种情况下,我们希望将身体质量指数的变化(存储在名为 *BMIChange12Months* 的变量中)视为饮食(存储在名为diet 的变量中)的函数,因此我们使用如下公式:
<semantics><mrow>【B3】【b】<mi>【m】</mi><mi>【I】<mi>【c】<mi><mi>【a】</mi></mi></mi></mi></mrow></semantics>
$$
BMIChange12Months \sim diet
$$
大多数统计软件(包括 R)会在模型包含一个名义变量时自动创建一组哑变量(比如 *diet* 变量,包含每个人接受的饮食名称)。以下是该模型与我们的数据相吻合的结果:
......@@ -102,15 +104,15 @@
## F-statistic: 3.58 on 3 and 307 DF, p-value: 0.0143
```
请注意,软件自动生成了与四种饮食中的三种相对应的虚拟变量,使得阿特金斯饮食没有虚拟变量。这意味着截距代表阿特金斯饮食组的平均值,其他三个变量模拟了每种饮食的平均值与阿特金斯饮食的平均值之间的差异。选择 Atkins 作为未建模的基线变量仅仅是因为它在字母顺序中是第一个。
请注意,软件自动生成了与四种饮食中的三种相对应的虚拟变量,使得Atkins饮食没有虚拟变量。这意味着截距代表阿特金斯饮食组的平均值,其他三个变量模拟了每种饮食的平均值与阿特金斯饮食的平均值之间的差异。选择 Atkins 作为未建模的基线变量仅仅是因为它在字母顺序中是第一个。
### 17.1.6 6。批评模型以确保它合适
### 17.1.6 6。惩罚模型以确保它拟合数据
我们要做的第一件事是评这个模型,以确保它是合适的。我们可以做的一件事是查看模型的残差。在图 [17.2](#fig:residualPlot) 中,我们绘制了按饮食分组的每个人的残差。不同条件下的残差分布没有明显的差异,我们可以继续分析。
我们要做的第一件事是评这个模型,以确保它是合适的。我们可以做的一件事是查看模型的残差。在图 [17.2](#fig:residualPlot) 中,我们绘制了按饮食分组的每个人的残差。不同条件下的残差分布没有明显的差异,我们可以继续分析。
![Distribution of residuals for for each condition](img/file101.png)
......@@ -146,8 +148,7 @@
## because they show NON-findings rather than findings.
## Consider using 'pairs()', 'pwpp()', or 'pwpm()' instead.
```
最右边一栏中的字母显示了哪些组彼此不同,使用的方法是根据正在进行的比较次数进行调整;共享一个字母的条件彼此之间没有显著差异。这表明阿特金斯饮食法和学习饮食法彼此没有区别(因为它们共享字母 a),学习饮食法、欧尼斯饮食法和区域饮食法彼此没有区别(因为它们共享字母 b),但是阿特金斯饮食法不同于欧尼斯饮食法和区域饮食法(因为它们没有共享字母)。
最右边一栏中的字母显示了哪些组彼此不同,使用的方法是根据正在进行的比较次数进行调整;共享一个字母的条件彼此之间没有显著差异。这表明Atkins饮食法和LEARN饮食法彼此没有区别(因为它们共享字母 a),LEARN饮食法、Ornish饮食法和Zone饮食法彼此没有区别(因为它们共享字母 b),但是Atkins饮食法不同于Ornish饮食法和Zone饮食法(因为它们没有共享字母)。
......@@ -158,18 +159,19 @@
如果我们更仔细地看看加德纳的论文,我们会发现他们还报告了每组中有多少人被诊断患有*代谢综合征*的统计数据,这是一种以高血压、高血糖、腰部脂肪过多和胆固醇水平异常为特征的综合征,与心血管问题的风险增加有关。加德纳论文的数据在表 [17.1](#tab:metsymData) 中列出。
<caption>Table 17.1: Presence of metabolic syndrome in each group in the AtoZ study.</caption>
| 规定饮食 | 普通 | 代谢综合征 |
| 饮食类型 | 普通 | 代谢综合征 |
| --- | --- | --- |
| 任何组织的基层人员 | Seventy-seven | Zero point two nine |
| 学习 | Seventy-nine | Zero point two five |
| 奥尼什语 | Seventy-six | Zero point three eight |
| 地区 | Seventy-nine | Zero point three four |
| Atkins | Seventy-seven | Zero point two nine |
| LEARN | Seventy-nine | Zero point two five |
| Ornish | Seventy-six | Zero point three eight |
| Zone | Seventy-nine | Zero point three four |
从数据来看,似乎各组之间的比率略有不同,在 Ornish 和 Zone 饮食中有更多的代谢综合征病例——这正是结果较差的饮食。假设我们对测试各组之间代谢综合征的发生率是否有显著差异感兴趣,因为这可能会使我们担心这些差异可能会影响饮食结果的结果。
#### 17.1.8.1 确定合适的型号
#### 17.1.8.1 确定合适的模型
* 什么样的因变量?
* 比例
......@@ -187,7 +189,7 @@
## X-squared = 4, df = 3, p-value = 0.3
```
该测试表明,平均值之间没有显著差异。然而,它并没有告诉我们有多确定没有差别;请记住,在 NHST 理论下,我们总是在假设零为真的情况下工作,除非数据向我们展示了足够的证据,使我们拒绝零假设。
该测试表明,平均值之间没有显著差异。然而,它并没有告诉我们有多确定没有差别;请记住,在 NHST 理论下,我们总是在假设零为真的情况下开展工作,除非数据向我们展示了足够的证据,让我们拒绝零假设。
如果我们想量化支持或反对零的证据呢?我们可以用贝叶斯因子来做这件事。
......@@ -214,7 +216,7 @@
## 17.2 求助
每当分析真实数据时,与训练有素的统计学家一起检查你的分析计划是有用的,因为真实数据中可能出现许多潜在的问题。事实上,在你开始这个项目之前,最好和统计学家谈谈,因为他们关于研究的设计或实施的建议可以让你在今后省去很多麻烦。大多数大学都有统计咨询办公室,为大学社团成员提供免费帮助。理解这本书的内容不会阻止你在某些时候需要他们的帮助,但它会帮助你与他们进行更明智的对话,并更好地理解他们提供的建议。
每当分析真实数据时,与训练有素的统计学家一起检查你的分析计划是有用的,因为真实数据中可能出现许多潜在的问题。事实上,在你开始这个项目之前,最好和统计学家谈谈,因为他们关于研究的设计或实施的建议可以让你在今后省去很多麻烦。大多数大学都有统计咨询办公室,为大学社团成员提供免费帮助。理解这本书的内容某些时候需要他们的帮助,但它会帮助你与他们进行更明智的对话,并更好地理解他们提供的建议。
此差异已折叠。
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册