我正在使用duc 2003数据集的参考摘要评估计算机生成的摘要。我尝试过pyrouge,但遇到了错误,files2rouge整个文档我只能得到一个分数。
使用easy-rouge的安装和评估非常简单,容易,但是我想知道为什么它不那么受欢迎,并且容易获得的乐谱与其他乐谱一样好吗?
pip install easy-rouge
from rouge.rouge import rouge_n_sentence_level
rouge_n_sentence_level(prediction_en[1], reference_en[1],2)
给出以下输出,
RougeScore(recall=0.35135135135135137, precision=0.3132530120481928, f1_measure=0.33121019108280253)