从用户输入的工作描述中,我需要使用python及其库来提取关键字或短语。对于哪些图书馆效果最好,我很乐意向社区提出建议和指导,如果简单的话,请进行指导。
用户输入示例:
user_input = "i want a full stack developer. Specialization in python is a must".
预期输出:
keywords = ['full stack developer', 'python']
答案 0 :(得分:1)
好的,设置好的关键字是一种好的方法。但是,关键是如何构建它。有很多方法可以做到。
首先,最简单的方法是搜索网络中设置的开放关键字。这取决于您的运气和知识。您的关键字(例如“ python,java,机器学习”)是Stackoverflow,招聘网站中的常用标签。不要违法!
第二个是IR(信息提取),它比最后一个复杂。算法很多,例如“ TextRank”,“ Entropy”,“ Apriori”,“ HMM”,“ Tf-IDF”,“ Conditional Random Fields”等等。
很幸运。
对于匹配关键字/阶段,Trie Tree
更快。
答案 1 :(得分:0)
好吧,我回答了我自己的问题。无论如何,谢谢那些回答。
keys = ['python', 'full stack developer','java','machine learning']
keywords = []
for i in range(len(keys)):
word = keys[i]
if word in keys:
keywords.append(word)
else:
continue
print(keywords)
输出符合预期!