ROUGE计算各种指标的召回,精确和F测量:ROUGE-N,ROUGE-L,ROUGE-W,ROUGE-S。 Here是ROUGE的论文。
ROUGE-N是匹配的n-grams的数量除以n-gram的总数。
ROUGE-L查看两个文本中最长的共同子序列,子序列可以包含间隙,以便1,3,5
是1,2,3,4,5
的子序列。
ROUGE-W也使用最长的共同子序列作为分数,但对较小间隙的子序列给予较高权重。
ROUGE-S使用skip-bigrams,skip-bigram是2-gram,可以包含任意2个单词,只要它们是句子顺序,即不必连续。