NLP:如何使用Gensim获得文本摘要的确切句数

时间:2017-10-24 16:27:58

标签: nlp text-processing gensim

我试图在python中使用Gensim总结一些文本,并且在我的摘要中只想要3个句子。似乎没有选择这样做,所以我做了以下解决方法:

with open ('speeches//'+speech, "r") as myfile:
    speech=myfile.read()
    sentences = speech.count('.')
    x = gensim.summarization.summarize(speech, ratio=3.0/sentences)

但是这段代码只给了我两句话。此外,随着我​​逐步增加3到5仍然没有任何反应。

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

您可能无法使用'比率'为了这。如果你给比率= 0.3,你有10个句子(假设每个句子中的单词数相同),你的输出将有3个句子,6个为20,依此类推。

根据gensim doc ratio(float,optional) - 0到1之间的数字,用于确定要为摘要选择的原始文本的句子数的比例。

相反,您可能想尝试使用 word_count 汇总(speech,word_count = 60)

这个问题有点陈旧,如果你找到了更好的解决方案,请分享。