使用python从文章的每个段落中提取关键字

时间:2018-08-28 08:46:05

标签: python machine-learning nlp nltk text-extraction

我想使用python从文章的每个段落中提取3-4个关键字。 我使用了Rake NLTK工具包,但它是从整篇文章中而不是从每个段落中提取关键字的。

我使用了以下代码:

from rake_nltk import Rake
import os
r = Rake()
Data = open('input.txt','r')
text = Data.read()

r.extract_keywords_from_text(text)
a = r.get_ranked_phrases()

str = ""
for i in a:
    str += i
    str += " "

str = str[:-1]
print(str)

但这会从整个文本文件中提取关键字,而不是分别从每个段落中提取关键字。

示例(必填):
第一个参数}-(汽车,红色,自行车)关键字
第二段}-(崩溃,汽车,自行车)关键字
3red para}-(警察,救护车)关键字

0 个答案:

没有答案