基于图表的自动摘要中句子提取的加权?

时间:2016-07-05 17:54:08

标签: machine-learning nlp summarization

我正在阅读一篇研究论文Automatic Text Document Summarization Based on Machine Learning,在表1中对应于基于图表的权重,他们使用了一个名为Aggregate Similarity的功能。

我试过在网上搜索,虽然我发现了诸如“灵活聚合相似度”之类的内容,但是我不确定它与自动摘要和称重句子的任务有什么关系。

聚合相似性的确切含义是什么?如何计算?

1 个答案:

答案 0 :(得分:1)

聚合相似度是每个节点相似度的总和(聚合相似度)。这种相似性只是所考虑的2个节点(2个句子)之间的词汇重叠除以2个信息的最长长度 - 张力(用于标准化)。

总体相似度衡量句子的重要性。

不是计算将节点(句子)连接到其他节点(布什路径)的链接数,而是聚合相似性对链接上的权重(相似性)求和。