未验证 提交 529eda8e 编写于 作者: 飞龙 提交者: GitHub

Merge pull request #33 from ThomasCai/master

更新24章翻译
......@@ -162,10 +162,12 @@ plt.scatter(x, y, color='darkblue', s=10);
**余弦相关性**
我们定义![](http://latex.codecogs.com/gif.latex?Y=\rhoX+\sqrt{1-\rho{^2}}Z)
我们定义
![](http://latex.codecogs.com/gif.latex?Y=\rho{X}+\sqrt{1-\rho{^2}}Z)
其中$X$和$Z$是独立同分布的标准正态变量。
我们从几何上理解这个结构。一个好的起点是X和Z的联合密度,它具有圆的对称性。
我们从几何上理解这个结构。一个好的开始是$X$和$Z$的联合密度,它具有圆的对称性。
```python
# NO CODE
......@@ -180,13 +182,13 @@ plt.title('Standard Bivariate Normal Distribution, Correlation = 0');
$X$轴和$Z$轴是正交的。让我们看看如果我们扭转它们会发生什么。
取任何正角度θ度并绘制与原始X轴成角度θ的新轴每个点(X,Z)在这个轴上都有一个投影。
取任何正角度θ度并绘制与原始X轴成角度θ的新轴每个点(X,Z)在这个轴上都有一个投影。
下图所示,点(X,Z)=(1,2)到金色轴的投影,金色轴与X轴成θ角。蓝色的部分是x的值,通过把(1,2)点向横轴上做垂线得到。这叫做投影(1,2)点到横轴上
下图所示,点(X,Z)=(1,2)到金色轴的投影,金色轴与$X$轴成θ角。蓝色的部分是$X$的值,通过把(1,2)点向横轴上做垂线得到,称为(1,2)点到横轴上的投影
红色部分是(1,2)点在金色轴上的投影,通过把(1,2)点向金色轴做垂线得到。
在下面的单元格中改变θ的值,以查看投影在金色轴旋转时如何变化。
在下面的单元格中改变θ的值,可以观察到投影在金色轴旋转时如何变化。
```python
theta = 20
......@@ -196,7 +198,88 @@ projection_1_2(theta)
设$Y$是红色段的长度,并记住$X$是蓝色段的长度。 当θ非常小时,$Y$几乎等于$X$。当θ接近90度时,Y几乎等于Z。
一点点三角法就表明了这一点:![](http://latex.codecogs.com/gif.latex?Y=X\cos(\theta)+Z\sin(\theta))
一点三角法就表明了这一点:![](http://latex.codecogs.com/gif.latex?Y=X\cos(\theta)+Z\sin(\theta))
```python
projection_trig()
```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190124193814982.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70)
因此
![](http://latex.codecogs.com/gif.latex?Y=X\cos(\theta)+Z\sin(\theta)=\rho{X}+\sqrt{1-\rho{^2}}Z)
其中![](http://latex.codecogs.com/gif.latex?\rho=\cos(\theta))
下面的一系列图像说明了θ为30度的转换。
```python
theta = 30
projection_1_2(theta)
```
![在这里插入图片描述](https://img-blog.csdnimg.cn/2019012419504497.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70)
当原始点(X, Z)具有独立同分布的标准正态坐标时,二元正态分布是蓝色和红色长度X和Y的联合分布。此变换(X, Z)的联合密度表面的圆形轮廓成(X, Y)的联合密度表面的椭圆形轮廓。
```python
cos(theta), (3**0.5)/2
>>(0.8660254037844387, 0.8660254037844386)
```
```python
rho = cos(theta)
Plot_bivariate_normal([0, 0], [[1, rho], [rho, 1]])
plt.title('Standard Bivariate Normal Distribution, Correlation = '+str(round(rho, 2)));
```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190124200025492.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70)
**小的θ**
正如我们前面看到的,当θ很小,几乎对轴的位置没做任何改变时,X和Y几乎相等。
```python
theta = 2
projection_1_2(theta)
```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190124200532501.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70)
因此,X和Y的二元正态密度本质上受限于X=Y线。cos(θ)的相关性很大因为θ很小;它的值超过0.999。
从而可以看到绘图函数是很难表示这个联合密度面的。
```python
rho = cos(theta)
rho
>>0.99939082701909576
```
```python
Plot_bivariate_normal([0, 0], [[1, rho], [rho, 1]])
```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190124201007761.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70)
**正交性和独立性**
当θ是90度,金色轴正交于X轴,并且Y = Z(其中Z与X是独立的)。
```python
theta = 90
projection_1_2(theta)
```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190124201516855.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1Rob21hc0NhaTAwMQ==,size_16,color_FFFFFF,t_70)
当θ= 90°时,cos(θ)= 0。(X,Y)的联合密度面与(X,Z)的联合密度面相同,并具有圆的对称性。
如果你把![](http://latex.codecogs.com/gif.latex?\rho{X})当作“信号”,把![](http://latex.codecogs.com/gif.latex?\sqrt{1-\rho{^2}}Z)当作“噪音”,那么$Y$可以被认为是一个观察的值“信号加噪声”。在本章剩下的部分中,我们将看看是否能将信号与噪声分开。
**二元正态的表示**
当我们只处理两个变量X和Y时,矩阵表示通常是不必要的。我们将交替使用以下三种表示。
- ![](http://latex.codecogs.com/gif.latex?X{_1})和![](http://latex.codecogs.com/gif.latex?X{_2})是具有![](http://latex.codecogs.com/gif.latex?(\mu{_1},\mu{_2},\sigma{^2_1},\sigma{^2_2},\rho))参数的二元正态变量
- 标准化变量![](http://latex.codecogs.com/gif.latex?X{^*_1})和![](http://latex.codecogs.com/gif.latex?X{^*_2})是标准的二元正态且相关性为![](http://latex.codecogs.com/gif.latex?\rho),那么![](http://latex.codecogs.com/gif.latex?X{^*_2}=\rho{X{^*_1}}+\sqrt{1-\rho{^2}}Z)(其中标准正态$Z$与![](http://latex.codecogs.com/gif.latex?X{^*_1})是相互独立的)。这是由多元正态的定义2得出的。
- ![](http://latex.codecogs.com/gif.latex?X{_1})和![](http://latex.codecogs.com/gif.latex?X{_2})有多元正态分布的均值向量![](http://latex.codecogs.com/gif.latex?[\mu{_1}\,\mu{_2}]{^T})和协方差矩阵
$$
\left[
\begin{matrix}
\sigma{^2_1} & \rho\sigma{_1}\sigma{_2} \\
\rho\sigma{_1}\sigma{_2} & \sigma{^2_2} \\
\end{matrix}
\right]
$$
## 02 线性最小二乘法
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册