1.机器学习实战-复习版.md 2.7 KB
Newer Older
片刻小哥哥's avatar
片刻小哥哥 已提交
1 2 3 4
# 第1章 机器学习实战-复习版(问题汇总)

## 1.VSCode的安装使用

片刻小哥哥's avatar
片刻小哥哥 已提交
5
参考文档: http://cwiki.apachecn.org/pages/viewpage.action?pageId=7373315
片刻小哥哥's avatar
片刻小哥哥 已提交
6 7 8

## 2.GitHub的使用说明

片刻小哥哥's avatar
片刻小哥哥 已提交
9
参考文档: https://github.com/apachecn/kaggle/blob/master/docs/github-quickstart.md
片刻小哥哥's avatar
片刻小哥哥 已提交
10

片刻小哥哥's avatar
片刻小哥哥 已提交
11
注意:  https://github.com/apachecn/AiLearning (这是本项目的地址,记得修改链接。。)
片刻小哥哥's avatar
片刻小哥哥 已提交
12 13 14

## 3.问题汇总

片刻小哥哥's avatar
片刻小哥哥 已提交
15
> 1.样本数据的来源: 
片刻小哥哥's avatar
片刻小哥哥 已提交
16 17 18 19 20 21

    1. 日志文件
    2. 数据库
    3. HDFS
    4. 数据流

片刻小哥哥's avatar
片刻小哥哥 已提交
22
> 2.样本数据按照一定比例来划分: 训练数据集 + 测试数据集 
片刻小哥哥's avatar
片刻小哥哥 已提交
23 24 25 26

    1. 根据业务场景来分析,得到对应的比例
    2. 一般设置是按照  训练数据集:测试数据集 = 8:2

片刻小哥哥's avatar
片刻小哥哥 已提交
27
> 3.训练数据集包括:  特征(也就是数据的纬度 or 属性) + 目标变量(分类结果 or 回归值)
片刻小哥哥's avatar
片刻小哥哥 已提交
28 29 30

> 4.测试数据用来干嘛?

片刻小哥哥's avatar
片刻小哥哥 已提交
31
如下图: 用于评估模型的效果。(测试样本的预测类别 和 测试样本的实际类别 的diff,就是我们的错误率)
片刻小哥哥's avatar
片刻小哥哥 已提交
32

W
wizardforcel 已提交
33
![机器学习训练过程图](../ml/img/机器学习基础训练过程.jpg)
片刻小哥哥's avatar
片刻小哥哥 已提交
34

片刻小哥哥's avatar
片刻小哥哥 已提交
35
> 5.监督学习和无监督学习的区别: 是否有目标变量(也就是: 是否存在分类结果)
片刻小哥哥's avatar
片刻小哥哥 已提交
36

片刻小哥哥's avatar
片刻小哥哥 已提交
37
> 6.电子书的下载位置: 
片刻小哥哥's avatar
片刻小哥哥 已提交
38

片刻小哥哥's avatar
片刻小哥哥 已提交
39
* 下载书籍:  https://github.com/apachecn/AiLearning/tree/python-2.7/books
片刻小哥哥's avatar
片刻小哥哥 已提交
40 41 42

> 7.性能不好是什么意思?

片刻小哥哥's avatar
片刻小哥哥 已提交
43
* 就是对比其他语言来说: 资源的使用效率受限、处理速度慢。
片刻小哥哥's avatar
片刻小哥哥 已提交
44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59

> 8.学习原理后,如果成为调包侠?调包侠是否很丑?

1. 学习原理后,就看看 [sklearn中文文档](http://sklearn.apachecn.org/): http://sklearn.apachecn.org, 转型做调包侠
2. 调包侠一点都不丑,为什么呢?
    * 便于分析业务,快速发现问题
    * 开发速度快,便于优化和维护

> 9.python讲解的版本 2.7.X

* 2.7.X版本测试比较稳定,没有Bug
* 3.X 的朋友刚好可以上手去熟悉 API 并 锻炼自我解决问题的能力,算是自我学习的一个方式吧
* 对于使用 3.X的朋友,可以提交 Pull Requests 到 3.X 分支,成为开源的贡献者,方便更多的人学习你的代码

## 4.复习的时间和资料

片刻小哥哥's avatar
片刻小哥哥 已提交
60 61 62 63 64 65
* 形式: 直播+讨论组
* 周期: 周一 ~ 周五
* 时间: 20:30 ~ 21:30
* 学习文档: https://github.com/apachecn/AiLearning
* 下载书籍:  https://github.com/apachecn/AiLearning/tree/python-2.7/books
* 活动日期: 2017-11-20 ~ 2017-12-08(共15天,1章1天)
66
* 活动详情: https://www.apachecn.org/machinelearning/279.html
片刻小哥哥's avatar
片刻小哥哥 已提交
67 68 69

## 5.直播方式

片刻小哥哥's avatar
片刻小哥哥 已提交
70
* QQ: 在讨论组共享屏幕(实时)
片刻小哥哥's avatar
片刻小哥哥 已提交
71 72 73 74 75 76
    * 视频会在 讨论组中进行分享
* B站的直播地址(延迟)
    * 直播地址: http://live.bilibili.com/5427054

## 6.机器学习QQ群

77
* ApacheCN - 学习机器学习群【724187166】
片刻小哥哥's avatar
片刻小哥哥 已提交
78 79 80 81

***

`装逼不装逼,我们还是老地方见! | ApacheCN`