提交 4781e9e2 编写于 作者: 滴水无痕0801's avatar 滴水无痕0801

update

上级 b2ec12d3
......@@ -13,9 +13,9 @@ tqdm
sklearn
## 中文数据集
我从[THUCNews](http://thuctc.thunlp.org/)中抽取了20万条新闻标题,数据集已上传至github,文本长度在20到30之间。一共10个类别,每类2万条数据
我从[THUCNews](http://thuctc.thunlp.org/)中抽取了20万条新闻标题,已上传至github,文本长度在20到30之间。一共10个类别,每类2万条
类别:财经、房产、股票、教育、科技、社会、时政、体育、游戏、娱乐
类别:财经、房产、股票、教育、科技、社会、时政、体育、游戏、娱乐
数据集划分:
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册