看了下你的eval结果感觉有点不可思议呀 #27

another1s · 2023-01-13T06:25:09Z

如题，原论文中report的sighan15的 sentence-wise的 detect和correct分别是 73.5和66.4，描述使用的训练集也是sighan13-15的三个training set以及他们自己构建多达5million的 news title数据。你这边sentence一口气提到了79.4，还是仅用sighan得数据finetune，这个差距也太大了吧

有没有可能你的统计指标跟它不一样呢。。我个人怀疑你用的是sighan15的全量数据进行测试，即无错误的负样本也计入了
但实际上后面一系列的csc文章，基本都只用正样本进行测试的

gitabtion · 2023-12-21T07:56:54Z

我很好奇，评测数据中没有负样本怎么计算precision和F1，数据或评测脚本均已开源，您可自行评测，或参照pycorretor仓库的相关函数重新进行评测。pycorrctor macbert4csc

关于指标的提升，我想额外说一句，在本实现之前，很少有实现保留预训练的MLMHead层权重去做FineTune的，而本仓库包括BBCM仓库在训练时，都保留了该层预训练参数，您要是感兴趣的话，可以做一个不加载该层预训练参数的消融实验，看是否能把指标降到您预期的范围内。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

看了下你的eval结果感觉有点不可思议呀 #27

看了下你的eval结果感觉有点不可思议呀 #27

another1s commented Jan 13, 2023

gitabtion commented Dec 21, 2023 •

edited

Loading

看了下你的eval结果感觉有点不可思议呀 #27

看了下你的eval结果感觉有点不可思议呀 #27

Comments

another1s commented Jan 13, 2023

gitabtion commented Dec 21, 2023 • edited Loading

gitabtion commented Dec 21, 2023 •

edited

Loading