我们目前在我们的图像共享网站上的多个服务器上部署了Solr。我们有1000万张图片,每月增加1/4万张。
到目前为止,Solr在选择搜索结果方面做得非常出色,但我们认为在排序/排名方面还有改进的空间。我们认为在排名中加入点击率可以显着改善结果。
我们目前通过MongoDB收集点击数据。我们记录每个术语点击图像的次数与显示的次数。例如:
[图片标识符],[搜索字词],[点击率]
“00000001”,“香蕉皮”,“0.1565”
“00000001”,“banana”,“0.0216”
“00000001”,“猴子香蕉”,“0.0087”
我们想要做的是找到一种方法将这种特定于搜索字词的点击数据合并到我们的Solr排名中。对于同一个术语点击的图像越多,它的排名就越高。我们还能找到一种干净利落的方法。
我们希望从外部加载数据,而不是将其作为Solr索引的一部分 - 因为我们希望点击数据几乎是实时的,并且希望保持我们的Solr目录不会过时巨大。
任何想法或想法都会非常非常感谢!
答案 0 :(得分:0)