Merge pull request #63 from yanmengk/dev

Update 1.机器学习概览.md

Merge pull request #63 from yanmengk/dev
Update 1.机器学习概览.md
7134ed04 · 飞龙 · GitHub · a962847e · b1a41912 · 7134ed04
隐藏空白更改
内联并排

Showing with 1 addition and 1 deletion

docs/1.机器学习概览.md docs/1.机器学习概览.md +1 -1

未找到文件。
--- a/docs/1.机器学习概览.md
+++ b/docs/1.机器学习概览.md
@@ -491,7 +491,7 @@ print(lin_reg_model.predict(X_new)) # outputs [[ 5.96242338]]

 答案在于，你在测试集上多次测量了推广误差率，调整了模型和超参数，以使模型最适合这个集合。这意味着模型对新数据的性能不会高。

-这个问题通常的解决方案是，再保留一个集合，称作验证集合。用测试集和多个超参数训练多个模型，选择在验证集上有最佳性能的模型和超参数。当你对模型满意时，用测试集再做最后一次测试，以得到推广误差率的预估。
+这个问题通常的解决方案是，再保留一个集合，称作验证集合。用训练集和多个超参数训练多个模型，选择在验证集上有最佳性能的模型和超参数。当你对模型满意时，用测试集再做最后一次测试，以得到推广误差率的预估。

 为了避免“浪费”过多训练数据在验证集上，通常的办法是使用交叉验证：训练集分成互补的子集，每个模型用不同的子集训练，再用剩下的子集验证。一旦确定模型类型和超参数，最终的模型使用这些超参数和全部的训练集进行训练，用测试集得到推广误差率。