Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
ml-mastery-zh
提交
377dadf0
M
ml-mastery-zh
项目概览
OpenDocCN
/
ml-mastery-zh
8 个月 前同步成功
通知
2
Star
556
Fork
158
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
M
ml-mastery-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
377dadf0
编写于
9月 17, 2019
作者:
ElamDavies
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
格式校验,翻译校正
上级
0e12fdf8
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
7 addition
and
8 deletion
+7
-8
docs/dl-keras/evaluate-skill-deep-learning-models.md
docs/dl-keras/evaluate-skill-deep-learning-models.md
+7
-8
未找到文件。
docs/dl-keras/evaluate-skill-deep-learning-models.md
浏览文件 @
377dadf0
# 如何评
价深度学习模型的技巧
# 如何评
估深度学习模型的性能
> 原文: [https://machinelearningmastery.com/evaluate-skill-deep-learning-models/](https://machinelearningmastery.com/evaluate-skill-deep-learning-models/)
...
...
@@ -14,7 +14,7 @@
您还将发现有用的相关统计数据,您可以计算这些统计数据以显示模型性能的技巧,例如标准偏差,标准误差和置信区间。
让我们开始吧
。
让我们开始吧
!
![
How to Evaluate the Skill of Deep Learning Models
](
img/8e1689ec640a31d8358af77078ac6bfb.png
)
...
...
@@ -38,8 +38,7 @@
这意味着每次相同的模型拟合相同的数据时,它可能会给出不同的预测,从而具有不同的性能。
## 评估模型的技巧
(_ 模型方差控制 _)
(_模型方差控制_)
我们可能没有所有的数据,如果有,我们就不需要做出预测。
通常情况下,我们有一个有限的数据样本,我们需要利用这些数据拟合出最好的模型。
...
...
@@ -63,7 +62,7 @@ skill = compare(test.y, predictions)
### 使用 k-fold 交叉验证
我们通常可以使用 k-fold 交叉验证等技术来加强这一点,并更准确地估计模型
技能。
这是一种系统地将可用数据分成 k 重折叠,在k-1折上训练数据以拟合模型,在保持折叠上进行评估模型,并对每个折叠重复此过程的技术。
我们通常可以使用 k-fold 交叉验证等技术来加强这一点,并更准确地估计模型
行性能,
这是一种系统地将可用数据分成 k 重折叠,在k-1折上训练数据以拟合模型,在保持折叠上进行评估模型,并对每个折叠重复此过程的技术。
这导致 k 个不同的模型具有 k 个不同的预测集合,并且反过来具有 k 个不同的性能分数。
...
...
@@ -92,7 +91,7 @@ standard_deviation = sqrt(1/count(scores) * sum( (score - mean_skill)^2 ))
```
## 评估随机模型的性能
(_
控制模型稳定性
_)
(_
控制模型稳定性
_)
一些随机模型,如深度神经网络,增加了一个额外的随机源。
...
...
@@ -117,7 +116,7 @@ for i in k:
scores
.
append
(
skill
)
```
这在每次运行代码
时
都需要相同的结果时,非常适合教程和演示。
这在每次运行代码
或
都需要相同的结果时,非常适合教程和演示。
这中做法是不稳定的,不建议用于评估模型。
...
...
@@ -157,7 +156,7 @@ standard_error = standard_deviation / sqrt(count(scores))
此外,我们可以使用 standard_error 来计算 mean_skill 的置信区间,假设结果的分布是高斯分布,您可以通过查看直方图,Q-Q 图或对收集的分数使用统计检验来检查。
例如,95%左右的间隔是平均性能的指标(1.96
*
标准误差)。
例如,
计算
95%左右的间隔是平均性能的指标(1.96
*
标准误差)。
```
py
interval
=
standard_error
*
1.96
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录