2.1.

f921b646 · wizardforcel · f921b646 · f921b646
隐藏空白更改
内联并排

Showing with 54 addition and 0 deletion

.gitignore .gitignore +2 -0

2.1.md 2.1.md +52 -0

未找到文件。
--- a/.gitignore
+++ b/.gitignore
+_book
+Thumbs.db
--- a/2.1.md
+++ b/2.1.md
+# 2.1 监督学习
+
+> 原文：[Machine Learning for Humans, Part 2.1: Supervised Learning](https://medium.com/machine-learning-for-humans/supervised-learning-740383a2feab)
+
+> 作者：[Vishal Maini](mailto:ml4humans@gmail.com)
+
+> 译者：[飞龙](https://github.com/wizardforcel)
+
+> 协议：[CC BY-NC-SA 4.0](http://creativecommons.org/licenses/by-nc-sa/4.0/)
+
+> 监督学习的两大任务：回归和分类。线性回归，损失函数和梯度下降。
+
+通过在数字广告上花费更多的钱，我们能挣多少钱？这个贷款的申请人是否能偿还贷款？股市明天会发生什么？
+
+在监督学习的问题中，我们以一个数据集开始，它包含训练样本，每个样本带有关联的正确标签。例如，学习分类手写数字的时候，监督学习算法接受数千张手写体数字的图片，以及标签，它们包含每个图片表示的正确数字。算法会学习图像和关联的数值的关系。之后将学到的关系用于划分全新的图片（不带标签），机器从来没有见过它们。这就是你可以通过使用手机拍张照片，来存入支票的原因。
+
+为了展示监督学习的工作原理，让我们看一个问题，根据某人完成的高等教育的年数，来预测年收入。更形式化来说，我们打算构建一个模型，它近似描述了高等教育年数`X`和对应年收入`Y`的关系`f`。
+
+```
+Y = f(X) + ϵ
+```
+
+> `X`（输入）为高等教育的年限
+> `Y`（输出）为年收入
+> `f`为描述`X`和`Y`关系的函数
+> `ϵ`（epsilon）为随机误差项（可正可负），均值为零
+
+> 关于`ϵ`：
+
+> `ϵ`表示模型的残余误差，它是你的算法的理论极限，由于你尝试解释的现象中存在固有噪声。例如，想象构建一个模型来预测抛硬币的结果。
+
+> 此外，数学家 [Paul Erdős](https://archive.is/o/VGPh3/https://en.wikipedia.org/wiki/Paul_Erd%C5%91s) 将孩子们称为`ϵ`，因为在微积分中（而不是统计学），`ϵ`代表任意小的正数值。很恰当吧？
+
+一种预测收入的方式，就是创建一个基于规则的严格模型，来表示收入和教育如何相关。例如，我估计出，高等教育每增加一年，年收入增加 $5000。
+
+```
+income = ($5,000 * years_of_education) + baseline_income
+```
+
+> 这个方式就是构建一个解的示例（而不是学习一个解，就像下面描述的线性回归方法那样）。
+
+通过包含一些规则，关于学位类型、工作年限、学校的层次，以及其它，你可以提出一个更复杂的模型。例如，“如果他们完成了学士或更高的学位，就将收入估计为 1.5 倍”。
+
+但是这种类型的，明确的基于规则的规划，对于复杂数据不是很有效。想像一下，尝试设计一个图像分类器算法，它由`if-then`语句组成。这些语句描述了像素亮度的组合，来判断它是否是一只猫。
+
+监督机器学习通过让计算机为你工作，来解决这个问题。通过识别数据中的规律，机器能够得到启发。这个和人类学习最大的差异是，机器学习运行在计算机硬件上，并且可以通过计算机科学和统计学的视角很好地理解，然而人类的模式识别发生在生物大脑中（不过完成了相同的目标）。
+
+在监督学习中，机器试图从零开始 学习收入和教育之间的关系，通过使用带标签的训练数据来运行算法。习得的函数可以用于估计人们的收入，其中收入`Y`是未知的，只要我们将教育年数`X`作为输入。换句话说，我们可以将我们的模型用于不带标签的测试数据来估计`Y`。
+
+监督学习的目标是，当获得`X`已知`Y`未知的新样本时，尽可能准确地预测`Y`。下面我们会探索多种最常见的方法。
+
+