用于计算关键字与短文本(50-100个单词)的相关性的算法

时间:2010-12-28 12:54:56

标签: algorithm string matching heuristics

我想计算关键字与简短描述文字的相关性。在效率和易于实施方面,最佳方法是什么。我正在使用C ++?

2 个答案:

答案 0 :(得分:6)

简单解决方案:计算文本中单词的出现次数。

要做好工作虽然像Google这样的公司多年来一直在努力解决这个问题。如果可能,您可能需要查看using their technology

要展开,请尝试以下操作:

这仍然只会让你到目前为止。您需要执行一些自然语言处理才能真正理解描述的内容,以区分包含关键字相同次数的多个文本。

答案 1 :(得分:3)