使用语义相似性的文本摘要

时间:2017-09-01 08:13:58

标签: nlp similarity summarization

我目前正在研究NLP项目,文本摘要,是否可以通过检查相似性beetwen句子来总结文本?如果可能,怎么样?或者为什么不呢?

由于

3 个答案:

答案 0 :(得分:1)

我所知道的一个通过语义相似性进行总结的站点是https://www.simplish.org。他们的方法是将文本转换为基本英语,然后为多维空间中的每个句子创建表意文字;以前的条件是将所有基本英语单词相互关联。第一个文本作为参考,表意文字序列作为摘要空间。该摘要空间内其他文档中的任何句子均被视为相关句子,并保留在最终摘要中,并且与现有句子过于相似的任何句子均被视为重复。因为该方法不依赖于任何特定的本体,主题图,单词,单词集或语法,所以它可以很好地用作多语言多文档摘要器。看看“示例”部分,那里有一些简化文本示例以及摘要。

答案 1 :(得分:0)

很有可能通过句子相似性进行汇总。使用这种相似性的最佳方法之一就是聚类。我建议看一下。您还可以使用另一种方法进行汇总,然后使用句子相似性来查找句子之间的共享信息,避免重复形成。

答案 2 :(得分:0)

有关在Python中使用提取摘要的方法的示例,请参阅PyTextRank以及wiki中的相关会话。

迈克·威廉姆斯也有一些优秀的资源和例子列在这里:https://mike.place/2016/summarization/