Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
Hypo
SZU_CSSE_master
提交
3e9aed16
S
SZU_CSSE_master
项目概览
Hypo
/
SZU_CSSE_master
通知
0
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
S
SZU_CSSE_master
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
3e9aed16
编写于
12月 14, 2019
作者:
H
hypox64
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update readme
上级
56e0612f
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
8 addition
and
6 deletion
+8
-6
README.md
README.md
+2
-2
course_report.md
course_report.md
+6
-4
images/House_Prices.jpg
images/House_Prices.jpg
+0
-0
未找到文件。
README.md
浏览文件 @
3e9aed16
### 1 比赛简介
选择的项目为
[
House Prices: Advanced Regression Techniques
](
https://www.kaggle.com/c/house-prices-advanced-regression-techniques
)
,该比赛要求参赛者使用爱荷华州艾姆斯市(Ames, Iowa)所销售房子的描述对其售价进行预测,是典型的回归问题。数据集包含1460个用于训练的房子描述+售价以及1459个用于测试的房子描述,每个对房子描述的描述包含79个标识,比如平方英尺大小,住宅类型,埃姆斯市区范围内的地理位置等。比赛要求对测试集的每个ID的描述给出SalePrice的预测值,评估标准使用预测值的对数与观察到的销售价格的对数之间的均方根误差
(RMSE)。
![
image
](
./images/House
Prices.jpg)
选择的项目为
[
House Prices: Advanced Regression Techniques
](
https://www.kaggle.com/c/house-prices-advanced-regression-techniques
)
,该比赛要求参赛者使用爱荷华州艾姆斯市(Ames, Iowa)所销售房子的描述对其售价进行预测,是典型的回归问题。数据集包含1460个用于训练的房子描述+售价以及1459个用于测试的房子描述,每个对房子描述的描述包含79个标识,比如平方英尺大小,住宅类型,埃姆斯市区范围内的地理位置等。比赛要求对测试集的每个ID的描述给出SalePrice的预测值,评估标准使用预测值的对数与观察到的销售价格的对数之间的均方根误差
(RMSE).
![
image
](
./images/House
_
Prices.jpg
)
<br>
为了实现比赛要求,对数据进行了预处理,特征工程等操作,并搭建了深度神经网络进行回归预测,最终获得前19%的分数。
![
image
](
./images/Ranking_1.jpg
)
...
...
course_report.md
浏览文件 @
3e9aed16
[toc]
### 1 比赛简介
选择的项目为
[
House Prices: Advanced Regression Techniques
](
https://www.kaggle.com/c/house-prices-advanced-regression-techniques
)
,该比赛要求参赛者使用爱荷华州艾姆斯市(Ames, Iowa)所销售房子的描述对其售价进行预测,是典型的回归问题。数据集包含1460个用于训练的房子描述+售价以及1459个用于测试的房子描述,每个对房子描述的描述包含79个标识,比如平方英尺大小,住宅类型,埃姆斯市区范围内的地理位置等。比赛要求对测试集的每个ID的描述给出SalePrice的预测值,评估标准使用预测值的对数与观察到的销售价格的对数之间的均方根误差
(RMSE)。
选择的项目为
[
House Prices: Advanced Regression Techniques
](
https://www.kaggle.com/c/house-prices-advanced-regression-techniques
)
,该比赛要求参赛者使用爱荷华州艾姆斯市(Ames, Iowa)所销售房子的描述对其售价进行预测,是典型的回归问题。数据集包含1460个用于训练的房子描述+售价以及1459个用于测试的房子描述,每个对房子描述的描述包含79个标识,比如平方英尺大小,住宅类型,埃姆斯市区范围内的地理位置等。比赛要求对测试集的每个ID的描述给出SalePrice的预测值,评估标准使用预测值的对数与观察到的销售价格的对数之间的均方根误差
(RMSE)
<br>
![
image
](
./images/House
Prices.jpg)
![
image
](
./images/House
_
Prices.jpg
)
为了实现比赛要求,对数据进行了预处理,特征工程等操作,并搭建了深度神经网络进行回归预测,最终获得前19%的分数。另外,比赛代码公开于
[
https://github.com/HypoX64/house-prices
](
https://github.com/HypoX64/house-prices
)
![
image
](
./images/Ranking_1.jpg
)
...
...
@@ -26,11 +26,11 @@
#### 2.5 实验结果的评价
比赛的评估标准使用预测值的对数与观察到的销售价格的对数之间的均方根误差(RMSE)以下公式所示。
比赛的评估标准使用预测值的对数与观察到的销售价格的对数之间的均方根误差(RMSE)以下公式所示。
<br>
$$
\b
egin{matrix}
\s
qrt{
\d
frac{
\s
um_{i=1}^N(
\l
g y_i-
\l
g
\h
at{y_i})^2}{N}}
\e
nd{matrix}
$$
然而由于我首选的是深度学习的方法,对于数值预测类任务其对应loss为MES,不需要对数及根号处理,所以本文中将统一使用下面的loss,值得注意的是这将导致程序跑出来的结果与最终提交结果不一致,但两者是同向的关系,这并不影响对模型效果的评估。
然而由于我首选的是深度学习的方法,对于数值预测类任务其对应loss为MES,不需要对数及根号处理,所以本文中将统一使用下面的loss,值得注意的是这将导致程序跑出来的结果与最终提交结果不一致,但两者是同向的关系,这并不影响对模型效果的评估。
<br>
$$
\b
egin{matrix}
\d
frac{
\s
um_{i=1}^N(y_i-
\h
at{y_i})^2}{N}
\e
nd{matrix}
$$
...
...
@@ -274,6 +274,7 @@ criterion = nn.MSELoss()
对比浅层神经网络于深层神经网络的结果,可以发现后者网络参数量大,仅仅迭代数十次就出现了过拟合的情况。再者,即使将网络结构精简到只有两层,依然会出现明显的过拟合现象。可见,从某种角度来说,这项比赛的数据量过小,似乎并不适合使用深度神经网络。
另外,通过对比是否应用PCA对结果的影响,可以发现PCA对于神经网络似乎甚至具有相反的效果。
最终结果如下:
| 网络类型 | loss |
| ---------------------------- | -------- |
| 简单的全连接神经网络_withPCA | 0.026172 |
...
...
@@ -334,6 +335,7 @@ model_svr = GridSearchCV(SVR(kernel="rbf"),
"epsilon"
:
np
.
logspace
(
-
4
,
-
3
,
5
)})
```
*
PCA维数以及模型loss的关系
| !
[
image
](
./images/0.026778_85_krr.png
)
| !
[
image
](
./images/0.030053_137_las.png
)
|
| -------------------------------------- | -------------------------------------- |
| !
[
image
](
./images/0.040413_121_model_xgb.png
)
| !
[
image
](
./images/0.030281_138_ENet.png
)
|
...
...
images/House
Prices.jpg
→
images/House
_
Prices.jpg
浏览文件 @
3e9aed16
文件已移动
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录