应用错误收集

时间：2016-07-05 17:54:08

标签： machine-learning nlp summarization

我正在阅读一篇研究论文Automatic Text Document Summarization Based on Machine Learning，在表1中对应于基于图表的权重，他们使用了一个名为Aggregate Similarity的功能。

我试过在网上搜索，虽然我发现了诸如“灵活聚合相似度”之类的内容，但是我不确定它与自动摘要和称重句子的任务有什么关系。

聚合相似性的确切含义是什么？如何计算？

答案 0 :(得分：1)

聚合相似度是每个节点相似度的总和（聚合相似度）。这种相似性只是所考虑的2个节点（2个句子）之间的词汇重叠除以2个信息的最长长度 - 张力（用于标准化）。

总体相似度衡量句子的重要性。

不是计算将节点（句子）连接到其他节点（布什路径）的链接数，而是聚合相似性对链接上的权重（相似性）求和。