前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
Created by: looput
请问下作者有验证过SRN在中文长文本(长度10~60字符)的效果吗?我跑了下,似乎收敛很慢,再输入 (32,512) batch size 96 情况下训练70k step 准确度才35%左右,是不是Transformer对长序列的处理不如RNN?