我想使用python从文章的每个段落中提取3-4个关键字。 我使用了Rake NLTK工具包,但它是从整篇文章中而不是从每个段落中提取关键字的。
我使用了以下代码:
from rake_nltk import Rake
import os
r = Rake()
Data = open('input.txt','r')
text = Data.read()
r.extract_keywords_from_text(text)
a = r.get_ranked_phrases()
str = ""
for i in a:
str += i
str += " "
str = str[:-1]
print(str)
但这会从整个文本文件中提取关键字,而不是分别从每个段落中提取关键字。
示例(必填):
第一个参数}-(汽车,红色,自行车)关键字
第二段}-(崩溃,汽车,自行车)关键字
3red para}-(警察,救护车)关键字