我试图在python中使用Gensim总结一些文本,并且在我的摘要中只想要3个句子。似乎没有选择这样做,所以我做了以下解决方法:
with open ('speeches//'+speech, "r") as myfile:
speech=myfile.read()
sentences = speech.count('.')
x = gensim.summarization.summarize(speech, ratio=3.0/sentences)
但是这段代码只给了我两句话。此外,随着我逐步增加3到5仍然没有任何反应。
非常感谢任何帮助。
答案 0 :(得分:0)
您可能无法使用'比率'为了这。如果你给比率= 0.3,你有10个句子(假设每个句子中的单词数相同),你的输出将有3个句子,6个为20,依此类推。
根据gensim doc ratio(float,optional) - 0到1之间的数字,用于确定要为摘要选择的原始文本的句子数的比例。
相反,您可能想尝试使用 word_count ,汇总(speech,word_count = 60)
这个问题有点陈旧,如果你找到了更好的解决方案,请分享。