前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
Created by: AltenLi
在2个自建数据集测试了,人工评估f1均比自动评估低0.15左右。 辛苦看下是代码问题还是fluid.layers.chunk_eval的问题