Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
prob140-textbook-zh
提交
529eda8e
P
prob140-textbook-zh
项目概览
OpenDocCN
/
prob140-textbook-zh
通知
13
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
prob140-textbook-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
未验证
提交
529eda8e
编写于
1月 25, 2019
作者:
飞
飞龙
提交者:
GitHub
1月 25, 2019
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #33 from ThomasCai/master
更新24章翻译
上级
e436e6d0
1727690d
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
89 addition
and
6 deletion
+89
-6
docs/24.md
docs/24.md
+89
-6
未找到文件。
docs/24.md
浏览文件 @
529eda8e
...
...
@@ -162,10 +162,12 @@ plt.scatter(x, y, color='darkblue', s=10);
**余弦相关性**
我们定义!
[](
http://latex.codecogs.com/gif.latex?Y=\rhoX+\sqrt{1-\rho{^2}}Z
)
我们定义
![](
http://latex.codecogs.com/gif.latex?Y=\rho{X}+\sqrt{1-\rho{^2}}Z
)
其中$X$和$Z$是独立同分布的标准正态变量。
我们从几何上理解这个结构。一个好的
起点是X和Z
的联合密度,它具有圆的对称性。
我们从几何上理解这个结构。一个好的
开始是$X$和$Z$
的联合密度,它具有圆的对称性。
```
python
# NO CODE
...
...
@@ -180,13 +182,13 @@ plt.title('Standard Bivariate Normal Distribution, Correlation = 0');
$X$轴和$Z$轴是正交的。让我们看看如果我们扭转它们会发生什么。
取任何正角度θ度并绘制与原始X轴成角度θ的新轴
。
每个点(X,Z)在这个轴上都有一个投影。
取任何正角度θ度并绘制与原始X轴成角度θ的新轴
,
每个点(X,Z)在这个轴上都有一个投影。
下图所示,点(X,Z)=(1,2)到金色轴的投影,金色轴与
X轴成θ角。蓝色的部分是x的值,通过把(1,2)点向横轴上做垂线得到。这叫做投影(1,2)点到横轴上
。
下图所示,点(X,Z)=(1,2)到金色轴的投影,金色轴与
$X$轴成θ角。蓝色的部分是$X$的值,通过把(1,2)点向横轴上做垂线得到,称为(1,2)点到横轴上的投影
。
红色部分是(1,2)点在金色轴上的投影,通过把(1,2)点向金色轴做垂线得到。
在下面的单元格中改变θ的值,
以查看
投影在金色轴旋转时如何变化。
在下面的单元格中改变θ的值,
可以观察到
投影在金色轴旋转时如何变化。
```
python
theta
=
20
...
...
@@ -196,7 +198,88 @@ projection_1_2(theta)
设$Y$是红色段的长度,并记住$X$是蓝色段的长度。 当θ非常小时,$Y$几乎等于$X$。当θ接近90度时,Y几乎等于Z。
一点点三角法就表明了这一点:!
[](
http://latex.codecogs.com/gif.latex?Y=X\cos(\theta
)
+Z
\s
in(
\t
heta))
一点三角法就表明了这一点:!
[](
http://latex.codecogs.com/gif.latex?Y=X\cos(\theta
)
+Z
\s
in(
\t
heta))
```
python
projection_trig
()
```
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/20190124193814982.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70
)
因此
![](
http://latex.codecogs.com/gif.latex?Y=X\cos(\theta
)
+Z
\s
in(
\t
heta)=
\r
ho{X}+
\s
qrt{1-
\r
ho{^2}}Z)
其中!
[](
http://latex.codecogs.com/gif.latex?\rho=\cos(\theta
)
)
下面的一系列图像说明了θ为30度的转换。
```
python
theta
=
30
projection_1_2
(
theta
)
```
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/2019012419504497.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70
)
当原始点(X, Z)具有独立同分布的标准正态坐标时,二元正态分布是蓝色和红色长度X和Y的联合分布。此变换(X, Z)的联合密度表面的圆形轮廓成(X, Y)的联合密度表面的椭圆形轮廓。
```
python
cos
(
theta
),
(
3
**
0.5
)
/
2
>>
(
0.8660254037844387
,
0.8660254037844386
)
```
```
python
rho
=
cos
(
theta
)
Plot_bivariate_normal
([
0
,
0
],
[[
1
,
rho
],
[
rho
,
1
]])
plt
.
title
(
'Standard Bivariate Normal Distribution, Correlation = '
+
str
(
round
(
rho
,
2
)));
```
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/20190124200025492.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70
)
**小的θ**
正如我们前面看到的,当θ很小,几乎对轴的位置没做任何改变时,X和Y几乎相等。
```
python
theta
=
2
projection_1_2
(
theta
)
```
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/20190124200532501.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70
)
因此,X和Y的二元正态密度本质上受限于X=Y线。cos(θ)的相关性很大因为θ很小;它的值超过0.999。
从而可以看到绘图函数是很难表示这个联合密度面的。
```
python
rho
=
cos
(
theta
)
rho
>>
0.99939082701909576
```
```
python
Plot_bivariate_normal
([
0
,
0
],
[[
1
,
rho
],
[
rho
,
1
]])
```
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/20190124201007761.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70
)
**正交性和独立性**
当θ是90度,金色轴正交于X轴,并且Y = Z(其中Z与X是独立的)。
```
python
theta
=
90
projection_1_2
(
theta
)
```
![
在这里插入图片描述
](
https://img-blog.csdnimg.cn/20190124201516855.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70
)
当θ= 90°时,cos(θ)= 0。(X,Y)的联合密度面与(X,Z)的联合密度面相同,并具有圆的对称性。
如果你把!
[](
http://latex.codecogs.com/gif.latex?\rho{X}
)
当作“信号”,把!
[](
http://latex.codecogs.com/gif.latex?\sqrt{1-\rho{^2}}Z
)
当作“噪音”,那么$Y$可以被认为是一个观察的值“信号加噪声”。在本章剩下的部分中,我们将看看是否能将信号与噪声分开。
**二元正态的表示**
当我们只处理两个变量X和Y时,矩阵表示通常是不必要的。我们将交替使用以下三种表示。
-
!
[](
http://latex.codecogs.com/gif.latex?X{_1}
)
和!
[](
http://latex.codecogs.com/gif.latex?X{_2}
)
是具有!
[](
http://latex.codecogs.com/gif.latex?(\mu{_1},\mu{_2},\sigma{^2_1},\sigma{^2_2},\rho
)
)参数的二元正态变量
-
标准化变量!
[](
http://latex.codecogs.com/gif.latex?X{^*_1}
)
和!
[](
http://latex.codecogs.com/gif.latex?X{^*_2}
)
是标准的二元正态且相关性为!
[](
http://latex.codecogs.com/gif.latex?\rho
)
,那么!
[](
http://latex.codecogs.com/gif.latex?X{^*_2}=\rho{X{^*_1}}+\sqrt{1-\rho{^2}}Z
)
(其中标准正态$Z$与!
[](
http://latex.codecogs.com/gif.latex?X{^*_1}
)
是相互独立的)。这是由多元正态的定义2得出的。
-
!
[](
http://latex.codecogs.com/gif.latex?X{_1}
)
和!
[](
http://latex.codecogs.com/gif.latex?X{_2}
)
有多元正态分布的均值向量!
[](
http://latex.codecogs.com/gif.latex?[\mu{_1}\,\mu{_2}]{^T}
)
和协方差矩阵
$$
\l
eft[
\b
egin{matrix}
\s
igma{^2_1} &
\r
ho
\s
igma{_1}
\s
igma{_2}
\\
\r
ho
\s
igma{_1}
\s
igma{_2} &
\s
igma{^2_2}
\\
\e
nd{matrix}
\r
ight]
$$
## 02 线性最小二乘法
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录