From 7146b59d4c04a7c1bcc04d6e1f36f553ca4da24b Mon Sep 17 00:00:00 2001
From: Steffy-zxf <48793257+Steffy-zxf@users.noreply.github.com>
Date: Fri, 18 Sep 2020 16:48:17 +0800
Subject: [PATCH] Update how_to_load_data.md

---
 docs/tutorial/how_to_load_data.md | 49 -------------------------------
 1 file changed, 49 deletions(-)

diff --git a/docs/tutorial/how_to_load_data.md b/docs/tutorial/how_to_load_data.md
index 9ea7b0e2..8e0321bf 100644
--- a/docs/tutorial/how_to_load_data.md
+++ b/docs/tutorial/how_to_load_data.md
@@ -30,39 +30,6 @@ text_a    label
 1.接电源没有几分钟,电源适配器热的不行. 2.摄像头用不起来. 3.机盖的钢琴漆，手不能摸，一摸一个印. 4.硬盘分区不好办.    0
 ```
 
-### 自定义数据加载	
-加载文本类自定义数据集，用户仅需要继承基类BaseNLPDatast，修改数据集存放地址以及类别即可。具体使用如下：	
-
-**NOTE:**	
-* 数据集文件编码格式建议为utf8格式。	
-* 如果相应的数据集文件没有上述的列说明，如train.tsv文件没有第一行的`text_a    label`，则train_file_with_header=False。	
-* 如果您还有预测数据（没有文本类别），可以将预测数据存放在predict.tsv文件，文件格式和train.tsv类似。去掉label一列即可。	
-* 分类任务中，数据集的label必须从0开始计数	
-
-
-```python	
-from paddlehub.dataset.base_nlp_dataset import BaseNLPDataset	
-class DemoDataset(BaseNLPDataset):	
-    """DemoDataset"""	
-    def __init__(self):	
-        # 数据集存放位置	
-        self.dataset_dir = "path/to/dataset"	
-        super(DemoDataset, self).__init__(	
-            base_path=self.dataset_dir,	
-            train_file="train.tsv",	
-            dev_file="dev.tsv",	
-            test_file="test.tsv",	
-            # 如果还有预测数据（不需要文本类别label），可以放在predict.tsv	
-            predict_file="predict.tsv",	
-            train_file_with_header=True,	
-            dev_file_with_header=True,	
-            test_file_with_header=True,	
-            predict_file_with_header=True,	
-            # 数据集类别集合	
-            label_list=["0", "1"])	
-dataset = DemoDataset()	
-```
-
 ## 二、CV类任务如何自定义数据
 
 利用PaddleHub迁移CV类任务使用自定义数据时，用户需要自己切分数据集，将数据集且分为训练集、验证集和测试集。
@@ -115,19 +82,3 @@ dog
 * 如果您的数据集类别较少，可以不用定义label_list.txt，可以选择定义label_list=["数据集所有类别"]。	
 * 分类任务中，数据集的label必须从0开始计数	
 
- ```python	
-from paddlehub.dataset.base_cv_dataset import BaseCVDataset	
-class DemoDataset(BaseCVDataset):	
-    def __init__(self):	
-        # 数据集存放位置	
-        self.dataset_dir = "/test/data"	
-        super(DemoDataset, self).__init__(	
-            base_path=self.dataset_dir,	
-            train_list_file="train_list.txt",	
-            validate_list_file="validate_list.txt",	
-            test_list_file="test_list.txt",	
-            predict_file="predict_list.txt",	
-            label_list_file="label_list.txt",	
-            # label_list=["数据集所有类别"])	
-dataset = DemoDataset()	
-```
-- 
GitLab