未验证 提交 a3dce569 编写于 作者: Z Ziseon Jiao 提交者: GitHub

修改“商业”名词翻译

上级 86cc0024
......@@ -157,7 +157,7 @@ array([ 2., 3., 4., 1., 0., 2., 2., 3., 3., 4., 4., 1., 1., 3., 2., 2., 4.])
分位数是将数据划分为相等部分的值。例如, 中位数将数据分成一半;一半的数据是较小的, 一半大于中位数。分位数把数据分成几个部分, 十分位数把数据划分成十份。示例2-4 演示如何计算 Yelp 商户评论数的十等分, 图2-5 覆盖直方图上的十等分。这就更清楚地说明了对更小的计数的歪斜。
### 例子 2-4。计算 Yelp 商评论数的十分位数
### 例子 2-4。计算 Yelp 商评论数的十分位数
```
>>> deciles = biz_df['review_count'].quantile([.1, .2, .3, .4, .5, .6, .7, .8, .9])
>>> deciles
......@@ -350,7 +350,7 @@ ax2.set_ylabel('Number of Shares', fontsize=14)
将此与应用于YELP评论数据集的相同散点图进行比较。图2-10看起来与图2-9非常不同。在1到5,步长0.5的区间,平均星级是离散的。高评论计数(大致>2500评论)与较高的平均星级评级相关。但这种关系远不是线性的。没有一种清晰的方法可以根据输入来预测平均星级。从本质上讲,该图表明,评论数及其对数都是平均星级的不良线性预测因子。
### 例2-11。可视化 Yelp 商评论预测中输入与输出的相关性。
### 例2-11。可视化 Yelp 商评论预测中输入与输出的相关性。
```
fig, (ax1, ax2) = plt.subplots(2,1)
......@@ -392,7 +392,7 @@ ax2.set_ylabel('Average Star Rating', fontsize=14)
只有当数据为正值时, Box-Cox 公式才能工作。对于非正数据, 可以通过加上固定常量来移动数值。当应用 Box-Cox 变换或更一般的功率变换时, 我们必须确定参数 λ 的值。这可能是通过最大似然(找到的λ,使产生的变换信号的高斯似然最大) 或贝叶斯方法。完全介绍 Box-Cox 和一般功率变换的使用超出了本书的范围。感兴趣的读者可以通过 Jack Johnston 和John DiNardo (McGraw Hill) 编写的Econometric Methods 找到更多关于幂转换的信息。幸运的是, Scipy 的数据包包含了一个 Box-Cox 转换的实现, 其中包括查找最佳变换参数。
### 例子2-12。Yelp商评论数的 Box-Cox 变换。
### 例子2-12。Yelp商评论数的 Box-Cox 变换。
```
>>> from scipy import stats
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册