使用python及其库从给定的短文本中提取关键字/短语

时间:2019-03-26 08:30:25

标签: python nlp match-phrase

从用户输入的工作描述中,我需要使用python及其库来提取关键字或短语。对于哪些图书馆效果最好,我很乐意向社区提出建议和指导,如果简单的话,请进行指导。

用户输入示例:

user_input = "i want a full stack developer. Specialization in python is a must".

预期输出:

keywords = ['full stack developer', 'python']

2 个答案:

答案 0 :(得分:1)

好的,设置好的关键字是一种好的方法。但是,关键是如何构建它。有很多方法可以做到。

首先,最简单的方法是搜索网络中设置的开放关键字。这取决于您的运气和知识。您的关键字(例如“ python,java,机器学习”)是Stackoverflow,招聘网站中的常用标签。不要违法!

第二个是IR(信息提取),它比最后一个复杂。算法很多,例如“ TextRank”,“ Entropy”,“ Apriori”,“ HMM”,“ Tf-IDF”,“ Conditional Random Fields”等等。

很幸运。

对于匹配关键字/阶段,Trie Tree更快。

答案 1 :(得分:0)

好吧,我回答了我自己的问题。无论如何,谢谢那些回答。

keys = ['python', 'full stack developer','java','machine learning']
keywords = []
for i in range(len(keys)):
    word = keys[i]
    if word in keys:
        keywords.append(word)
    else:
        continue
print(keywords) 

输出符合预期!