我正在尝试找到从给定文本中提取相似关键字的最佳方法或算法。
我进行了很多搜索,找到了RAKE / MAUI和其他NLP算法,但是它们并不能完全满足我的要求。我不想输入文本并提取关键字,但是我想输入文本+主关键字,并以某种方式提取与主关键字相关的关键字。也许Damerau-Levenshtein算法会更好?
您能指出我要执行此操作的PHP脚本/算法吗? 例如,假设我们有以下文本: “来自纽约的最好的水管工非常昂贵。有时,在纽约使用水管工可能会很困难,但最终它将完成工作。 便宜的水管工会使事情变得更艰难,因为通常他不会很专业。 紧急水管可以24/7“找到
1)我想输入关键字: 水管工纽约
2)上面的文本以及返回这些关键字的脚本: 纽约最好的水管工
纽约的水管工
紧急管道
便宜的水管工
我该如何实现?
答案 0 :(得分:0)
您需要使用一种可以查看关系的方法,RAKE,MAUI等将不会为您做到这一点。您可以将它们用作获取文本相关关键字的第一步。我建议您查看基于图形的提取,例如页面排名。