Question

我试图在python中使用Gensim总结一些文本，并且在我的摘要中只想要3个句子。似乎没有选择这样做，所以我做了以下解决方法：

with open ('speeches//'+speech, "r") as myfile:
    speech=myfile.read()
    sentences = speech.count('.')
    x = gensim.summarization.summarize(speech, ratio=3.0/sentences)

但是这段代码只给了我两句话。此外，随着我逐步增加3到5仍然没有任何反应。

非常感谢任何帮助。

Answer 1

您可能无法使用＆＃39;比率＆＃39;为了这。如果你给比率= 0.3，你有10个句子（假设每个句子中的单词数相同），你的输出将有3个句子，6个为20，依此类推。

根据gensim doc ratio（float，optional） - 0到1之间的数字，用于确定要为摘要选择的原始文本的句子数的比例。

相反，您可能想尝试使用 word_count ，汇总（speech，word_count = 60）

这个问题有点陈旧，如果你找到了更好的解决方案，请分享。

NLP：如何使用Gensim获得文本摘要的确切句数

1 个答案: