未验证 提交 2e50fc8d 编写于 作者: 飞龙 提交者: GitHub

Merge pull request #121 from AnEscapist/patch-2

Update 2.一个完整的机器学习项目.md
......@@ -300,7 +300,7 @@ def load_housing_data(housing_path=HOUSING_PATH):
图 2-6 房屋信息
数据集中共有 20640 个实例,按照机器学习的标准这个数据量很小,但是非常适合入门。我们注意到总房间数只有 20433 个非空值,这意味着有 207 个街区缺少这个值。我们将在后面对它进行处理。
数据集中共有 20640 个实例,按照机器学习的标准这个数据量很小,但是非常适合入门。我们注意到总卧室数只有 20433 个非空值,这意味着有 207 个街区缺少这个值。我们将在后面对它进行处理。
所有的属性都是数值的,除了离大海距离这项。它的类型是对象,因此可以包含任意 Python 对象,但是因为该项是从 CSV 文件加载的,所以必然是文本类型。在刚才查看数据前五项时,你可能注意到那一列的值是重复的,意味着它可能是一项表示类别的属性。可以使用`value_counts()`方法查看该项中都有哪些类别,每个类别中都包含有多少个街区:
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册