ch10.

74b6a0d0 · wizardforcel · aba304da · 74b6a0d0
隐藏空白更改
内联并排

Showing with 100 addition and 0 deletion

10.md 10.md +100 -0

未找到文件。
--- a/10.md
+++ b/10.md
@@ -236,3 +236,103 @@ ACLU 报告讨论了这些差异的几个可能的原因。例如，一些少数

 所有这些都产生了复杂问题，就是如何准确估计阿拉米达县合格陪审员的种族构成。

+目前还不清楚，1453 个陪审团成员如何划分为不同的种族类别（ACLU 报告称“律师......合作收集陪审团数据”）。 存在严重的社会，文化和政治因素，影响谁被归类或自我分类到每个种族类别。 我们也不知道陪审团中这些类别的定义，是否与 Weeks 教授所使用的定义相同，Weeks 教授又在它的估算过程中使用了人口普查类别。 因此被比较的两个分布的对应关系，也存在问题。
+
+### 美国最高法院，1965年：斯温 VS 阿拉巴马州
+
+在二十世纪六十年代初期，阿拉巴马州的塔拉迪加县，一个名叫罗伯特·斯温的黑人被指控强奸一名白人妇女，并被判处死刑。 
+他援引所有陪审团是白人的其他因素，对他的判决提出上诉。当时，只有 21 岁或以上的男子被允许在塔拉迪加县的陪审团中任职。 在县里，合格的陪审员中有 26% 是黑人，但在 Swain 的审判中选出的 100 名陪审团中只有 8 名黑人男子。 审判陪审团没有选定黑人。
+
+1965 年，美国最高法院驳回了斯温的上诉。 法院在其裁决中写道：“整体百分比差距很小，没有反映出包括或排除特定数量的黑人的尝试”。（... the overall percentage disparity has been small and reflects no studied attempt to include or exclude a specified number of Negroes.）
+
+让我们用我们开发的方法来检查，陪审团中的 100 名黑人中的 8 名与合格陪审员的分布之间的差异。
+
+```py
+swain_jury = Table().with_columns(
+    'Ethnicity', make_array('Black', 'Other'),
+    'Eligible', make_array(0.26, 0.74),
+    'Panel', make_array(0.08, 0.92)
+)
+
+swain_jury
+```
+
+
+| Ethnicity | Eligible | Panel |
+| --- | --- |
+| Black | 0.26 | 0.08 |
+| Other | 0.74 | 0.92 |
+
+```py
+table_tvd(swain_jury, 'Eligible', 'Panel')
+0.18000000000000002
+```
+
+两个分布之间的 TVD 是 0.18。 这与合格总体的分布和随机样本之间的 TVD 比较如何？
+
+为了回答这个问题，我们可以模拟从随机样本中计算的 TVD。
+
+```py
+# Compute empirical distribution of TVDs
+
+panel_size = 100
+repetitions = 5000
+
+tvds = make_array()
+
+for i in np.arange(repetitions):
+
+    new_sample = proportions_from_distribution(swain_jury, 'Eligible', panel_size)
+    tvds = np.append(tvds, table_tvd(new_sample, 'Eligible', 'Random Sample'))
+
+results = Table().with_column('TVD', tvds)
+results.hist(bins = np.arange(0, 0.2, 0.01))
+```
+
+随机样本的 TVD 小于我们所得的值 0.18，它是陪审团和合格陪审员的 TVD。
+
+在这个分析中，数据并没有像我们以前的分析那样被问题盖住 - 涉及的人总数相对较少，而且最高法院案件的统计工作也很仔细。
+
+因此，我们的分析有了明确的结论，那就是陪审团不是总体的代表。 最高法院的判决“整体百分比差距很小”是很难接受的。
+
+## 检验的术语
+
+在陪审团选择的例子的背景下，我们已经形成了一些假设统计检验的基本概念。使用统计检验作为决策的一种方法是许多领域的标准，并且存在标准的术语。以下是大多数统计检验中的步骤顺序，以及一些术语和示例。
+
+### 第一步：假设
+
+所有的统计检验都试图在世界的两种观点中进行选择。具体而言，选择是如何生成数据的两种观点之间的选择。这两种观点被称为假设。
+
+原（零）假设。这就是说，数据在明确指定的假设条件下随机生成，这些假设使计算几率成为可能。 “零”一词强化了这样一个观点，即如果数据看起来与零假设的预测不同，那么这种差异只是偶然的。
+
+在阿拉米达县陪审团选择的例子中，原假设是从合格的陪审员人群中，随机抽取这些陪审团。虽然审团的种族组成与合格的陪审员的总体不同，但除了几率变化以外，没有任何理由存在差异。
+
+备选假设。这就是说，除了几率以外的某些原因使数据与原假设所预测的数据不同。非正式而言，备选假设认为观察到的差异是“真实的”。
+
+在我们阿拉米达县陪审团选择的例子中，备选假设是，这些小组不是随机选出来的。除了几率以外的事情导致了，陪审团的种族组成和合格陪审员总体的种族组成之间存在差异。
+
+### 第二步：检验统计量
+
+为了在这两个假设之间作出决策，我们必须选择一个统计量作为我们决策的依据。 这被称为检验统计量。
+
+在阿拉米达县陪审团的例子中，我们使用的检验统计量是，陪审团与合格陪审员的总体的种族分布之间的总变异距离。
+
+计算检验统计量的观察值通常是统计检验中的第一个计算步骤。 在我们的例子中，陪审团与总体之间的总变异距离的观察值是 0.14。
+
+### 第三步：检验统计量的概率分布，在原假设下
+
+这个步骤把检验统计量的观察值放在一边，而是把重点放在，如果原假设为真，统计量的值是什么。 在原假设下，由于几率，样本可能出现不同的情况。 所以检验统计量可能会有所不同。 这个步骤包括在随机性的原假设下，计算出所有可能的检验统计量及其所有概率。
+
+换句话说，在这个步骤中，我们假设原假设为真，并计算检验统计量的概率分布。 对于许多检验统计量来说，这在数学和计算上都是一项艰巨的任务。 因此，我们通过抽样过程的大量重复，通过统计量的经验分布来近似检验统计量的概率分布。
+
+在我们的例子中，我们通过直方图可视化了这个分布。
+
+### 第四步 检验的结论
+
+原假设和备选假设之间的选择，取决于步骤 2 和 3 的结果之间的比较：检验统计量的观察值以及它的分布，就像由原假设预测的那样。
+
+如果二者一致，则观察到的检验统计量与原假设的预测一致。 换句话说，这个检验并不偏向备选假设；数据更加支持原假设。
+
+但如果两者不一致，就像我们阿拉米达县陪审团的例子那样，那么数据就不支持原假设。 这就是为什么我们得出结论，陪审团不是随机挑选的。 几率之外的东西影响了他们的构成。
+
+如果数据不支持原假设，我们说检验拒绝了原假设。