我正在阅读一篇研究论文Automatic Text Document Summarization Based on Machine Learning,在表1中对应于基于图表的权重,他们使用了一个名为Aggregate Similarity的功能。
我试过在网上搜索,虽然我发现了诸如“灵活聚合相似度”之类的内容,但是我不确定它与自动摘要和称重句子的任务有什么关系。
聚合相似性的确切含义是什么?如何计算?
答案 0 :(得分:1)
聚合相似度是每个节点相似度的总和(聚合相似度)。这种相似性只是所考虑的2个节点(2个句子)之间的词汇重叠除以2个信息的最长长度 - 张力(用于标准化)。
总体相似度衡量句子的重要性。
不是计算将节点(句子)连接到其他节点(布什路径)的链接数,而是聚合相似性对链接上的权重(相似性)求和。