Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
hands-on-ml-zh
提交
42e9dc4f
H
hands-on-ml-zh
项目概览
OpenDocCN
/
hands-on-ml-zh
通知
13
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
H
hands-on-ml-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
未验证
提交
42e9dc4f
编写于
8月 08, 2018
作者:
飞
飞龙
提交者:
GitHub
8月 08, 2018
浏览文件
操作
浏览文件
下载
差异文件
Merge pull request #91 from xinqiu/patch-3
修改图片链接
上级
808c98d9
fa91c541
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
3 addition
and
3 deletion
+3
-3
docs/7.集成学习和随机森林.md
docs/7.集成学习和随机森林.md
+3
-3
未找到文件。
docs/7.集成学习和随机森林.md
浏览文件 @
42e9dc4f
...
...
@@ -355,15 +355,15 @@ for n_estimators in range(1, 120):
为了训练这个
*blender*
,一个通用的方法是采用保持集。让我们看看它怎么工作。首先,训练集被分为两个子集,第一个子集被用作训练第一层(详见图 7-13).
![
图7-13
](
../images/chapter_7/7-1
2
.png
)
![
图7-13
](
../images/chapter_7/7-1
3
.png
)
接下来,第一层的分类器被用来预测第二个子集(保持集)(详见 7-14)。这确保了预测结果很“干净”,因为这些分类器在训练的时候没有使用过这些事例。现在对在保持集中的每一个实例都有三个预测值。我们现在可以使用这些预测结果作为输入特征来创建一个新的训练集(这使得这个训练集是三维的),并且保持目标数值不变。随后
*blender*
在这个新的训练集上训练,因此,它学会了预测第一层预测的目标值。
![
图7-14
](
../images/chapter_7/7-1
2
.png
)
![
图7-14
](
../images/chapter_7/7-1
4
.png
)
显然我们可以用这种方法训练不同的
*blender*
(例如一个线性回归,另一个是随机森林等等):我们得到了一层
*blender*
。诀窍是将训练集分成三个子集:第一个子集用来训练第一层,第二个子集用来创建训练第二层的训练集(使用第一层分类器的预测值),第三个子集被用来创建训练第三层的训练集(使用第二层分类器的预测值)。以上步骤做完了,我们可以通过逐个遍历每个层来预测一个新的实例。详见图 7-15.
![
图7-15
](
../images/chapter_7/7-1
2
.png
)
![
图7-15
](
../images/chapter_7/7-1
5
.png
)
然而不幸的是,sklearn 并不直接支持 stacking ,但是你自己组建是很容易的(看接下来的练习)。或者你也可以使用开源的项目例如
*brew*
(网址为
<https://github.com/viisar/brew>
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录