标签: algorithm string matching heuristics
我想计算关键字与简短描述文字的相关性。在效率和易于实施方面,最佳方法是什么。我正在使用C ++?
答案 0 :(得分:6)
简单解决方案:计算文本中单词的出现次数。
要做好工作虽然像Google这样的公司多年来一直在努力解决这个问题。如果可能,您可能需要查看using their technology
要展开,请尝试以下操作:
这仍然只会让你到目前为止。您需要执行一些自然语言处理才能真正理解描述的内容,以区分包含关键字相同次数的多个文本。
答案 1 :(得分:3)
请参阅以前的Stack Overflow问题:
What are Useful Ranking Algorithms for Documents without Links (e.g. PDF, MS Documents, etc…)?
Algorithm for generating a 'top list' using word frequency.