Arxiv链接
一、评价
在性能提升难以判断是否显著时,可以使用McNemar 显著性检验来判断
本文的实验设置很值得学习:不仅从有效性、效率、泛化能力上进行评估,针对其中每一个层面,又单独设置了多组,比如有效性上,对比按照是否为Tran
2025-07-26