Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
python_data_analysis_and_mining_action
提交
38a29652
P
python_data_analysis_and_mining_action
项目概览
OpenDocCN
/
python_data_analysis_and_mining_action
9 个月 前同步成功
通知
12
Star
1527
Fork
690
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
python_data_analysis_and_mining_action
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
提交
38a29652
编写于
11月 03, 2017
作者:
wnma3mz
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update note
上级
420c5a48
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
56 addition
and
5 deletion
+56
-5
.fuse_hidden0000029800000001
.fuse_hidden0000029800000001
+39
-0
导入模块说明.md
导入模块说明.md
+7
-3
简单的笔记.md
简单的笔记.md
+10
-2
未找到文件。
.fuse_hidden0000029800000001
0 → 100755
浏览文件 @
38a29652
## 导入模块说明
```python
# 导入的常规模块
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt # 可视化操作
import os # 系统文件处理模块
import time # 时间处理模块
from random import shuffle # 用于随机打乱数据
import pywt # 小波处理的模块
import numpy.random import shuffle # 用于随机打乱数据
import pickle # 保存模型,
# 按名称排序
from scipy.interpolate import lagrange # 拉格朗日填值
from scipy.io import loadmat # 读取matlab的格式文件
from sklearn import svm
from sklearn.cluster import KMeans # KMeans聚类
from sklearn.decomposition import PCA # 主成分分析
from sklearn.externals.six import StringIO # 将决策树导出为dot
from sklearn.externals import joblib # 用于保存模型
from sklearn.linear_model import LogisticRegression as LR # 线性回归
from sklearn.linear_model import RandomizedLogisticRegression as RLR # 随机森林
from sklearn.manifold import TSNE # 数据降维
from sklearn.metrics import roc_curve # ROC曲线
from sklearn.metrics import confusion_matrix # 计算混淆矩阵,评估分类的准确性
from sklearn.tree import DecisionTreeClassifier as DTC # 决策树
from sklearn.tree import export_graphviz # 用于生成决策树的dot文件
from statsmodels.graphics.tsaplots import plot_acf # plot_acf自相关图
from statsmodels.graphics.tsaplots import plot_pacf # plot_pacf自相关图
from statsmodels.tsa.stattools import adfuller as ADF # adf检验
from statsmodels.tsa.arima_model import ARIMA # 建立ARIMA模型
from statsmodels.stats.diagnostic import acorr_ljungbox # 白噪声检验
from keras.models import Sequential # Kears神经网络训练
from keras.layers.core import Dense, Activation # Kears的常用的两个层
```
导入模块说明.md
浏览文件 @
38a29652
...
...
@@ -7,18 +7,22 @@ import numpy as np
import
matplotlib.pyplot
as
plt
# 可视化操作
import
os
# 系统文件处理模块
import
time
# 时间处理模块
from
random
import
shuffle
# 用于随即打乱数据
import
pywt
# 小波处理的模块
import
pickle
# 保存模型, python自带模块
from
numpy.random
import
shuffle
# 用于随机打乱数据
from
random
import
shuffle
# 用于随机打乱数据
# 按名称排序
from
scipy.interpolate
import
lagrange
# 拉格朗日填值
from
scipy.io
import
loadmat
# 读取matlab的格式文件
from
sklearn
import
svm
# 支持向量机
from
sklearn.cluster
import
KMeans
# KMeans聚类
from
sklearn.decomposition
import
PCA
# 主成分分析
from
sklearn.externals.six
import
StringIO
# 将决策树导出为dot
from
sklearn.externals
import
joblib
# 用于保存模型
from
sklearn.linear_model
import
LogisticRegression
as
LR
# 线性回归
from
sklearn.linear_model
import
RandomizedLogisticRegression
as
RLR
# 随机森林
from
scipy.interpolate
import
lagrange
# 拉格朗日填值
from
scipy.io
import
loadmat
# 读取matlab的格式文件
from
sklearn.manifold
import
TSNE
# 数据降维
from
sklearn.metrics
import
roc_curve
# ROC曲线
from
sklearn.metrics
import
confusion_matrix
# 计算混淆矩阵,评估分类的准确性
...
...
简单的笔记.md
浏览文件 @
38a29652
...
...
@@ -60,4 +60,13 @@ graph.write_pdf("name.pdf")
1.
很容易查出任意界限值时的对疾病的识别能力
2.
选择最佳的诊断界限值。ROC曲线越靠近左上角,试验的准确性就越高。
3.
两种或两种以上不同诊断试验对疾病识别能力的比较。直观的比较两种诊断方式的优劣
\ No newline at end of file
3.
两种或两种以上不同诊断试验对疾病识别能力的比较。直观的比较两种诊断方式的优劣
### 关于模型的保存
在这里建议使用sklearn自带的方法进行保存
`from sklearn.externals import joblib`
### shuffle函数说明
`from random import shuffle`
自带的模块用于随机打乱list的数据
`from numpy.random import shuffle`
用于随机打乱array数组的数据
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录