如何从长搜索字符串中查找趋势标签

时间:2009-10-27 16:14:39

标签: search tags cloud

根据用户的搜索结果,我希望在我的网站上有一个趋势标签。我没有看到一个简单的解决方案的问题是如何轻松地从搜索字符串中提取重要的术语。例如,许多用户可能会搜索具有不同目的的“视觉工作室”。例如,“visual studio 2010”,“visual studio unit testing”,“visual studio web forms components”。在这3次搜索中,“视觉工作室”呈现趋势。一个算法如何注意到,因为“视觉工作室”在大多数情况下会与许多其他词混合在一起?

谢谢!

2 个答案:

答案 0 :(得分:2)

  1. 将每个搜索查询拆分为单个单词数组。
  2. 计算单词之间的距离(更近,更好=>更高的值)
  3. 在所有查询中为每个wordpair添加此单词距离。
  4. 值较高的wordpairs是您的“趋势标签”。

答案 1 :(得分:1)

看看这个codeplex项目

http://www.codeplex.com/TheTagCloud

包含一个可以将html文件作为输入传递并返回标签云的函数。