Add random input for seq2seq to test.

0b93f490 · guosheng · 21f50136 · 0b93f490 · 0b93f490
隐藏空白更改
内联并排

Showing with 33 addition and 10 deletion

seq2seq/seq2seq.py seq2seq/seq2seq.py +2 -1

seq2seq/train.py seq2seq/train.py +31 -9

未找到文件。
--- a/seq2seq/seq2seq.py
+++ b/seq2seq/seq2seq.py
@@ -223,7 +223,8 @@ class Seq2Seq(Model):
        # encoder
        encoder_output, encoder_final_state = self.encoder(src, src_length)

-        # decoder initial states
+        # decoder initial states: use input_feed and the structure is
+        # [[h,c] * num_layers, input_feed]
        decoder_initial_states = [
            encoder_final_state,
            self.decoder.lstm_attention.cell.get_initial_states(

--- a/seq2seq/train.py
+++ b/seq2seq/train.py
@@ -80,6 +80,37 @@ def do_train(args):
        Input([None, None, 1], "int64", name="label"),
    ]

+    model = Seq2Seq(args.src_vocab_size, args.trg_vocab_size, args.embed_dim,
+                    args.hidden_size, args.num_layers, args.dropout)
+
+    model.prepare(fluid.optimizer.Adam(learning_rate=args.learning_rate,
+                                       parameter_list=model.parameters()),
+                  CrossEntropyCriterion(),
+                  inputs=inputs,
+                  labels=labels)
+
+    batch_size = 32
+    src_seq_len = 10
+    trg_seq_len = 12
+    iter_num = 10
+    def random_generator():
+        for i in range(iter_num):
+            src = np.random.randint(2, args.src_vocab_size,
+                                    (batch_size, src_seq_len)).astype("int64")
+            src_length = np.random.randint(
+                1, src_seq_len, (batch_size, )).astype("int64")
+            trg = np.random.randint(2, args.trg_vocab_size,
+                                    (batch_size, trg_seq_len)).astype("int64")
+            trg_length = np.random.randint(1, trg_seq_len,
+                                        (batch_size, )).astype("int64")
+            label = np.random.randint(1, trg_seq_len,
+                                    (batch_size, trg_seq_len, 1)).astype("int64")
+            yield src, src_length, trg, trg_length, label
+
+    model.fit(train_data=random_generator, log_freq=1)
+    exit(0)
+
+
    dataset = Seq2SeqDataset(fpattern=args.training_file,
                             src_vocab_fpath=args.src_vocab_fpath,
                             trg_vocab_fpath=args.trg_vocab_fpath,
@@ -107,15 +138,6 @@ def do_train(args):
                              num_workers=0,
                              return_list=True)

-    model = Seq2Seq(args.src_vocab_size, args.trg_vocab_size, args.embed_dim,
-                    args.hidden_size, args.num_layers, args.dropout)
-
-    model.prepare(fluid.optimizer.Adam(learning_rate=args.learning_rate,
-                                       parameter_list=model.parameters()),
-                  CrossEntropyCriterion(),
-                  inputs=inputs,
-                  labels=labels)
-
    model.fit(train_data=train_loader,
              eval_data=None,
              epochs=1,