我想问一下有关个性化搜索的问题。我即将使用Lucene设计/实现个性化搜索。我做了一些谷歌搜索,但似乎没有找到准备与Lucene一起使用的模块/工具。所以我想我需要自己实现一个。我想知道是否有任何可用的工具,以便我不重新发明轮子。
如果没有可用的东西,也没关系。但我想知道是否有任何关于如何实施它的建议。我目前的想法是为每个文档添加一个额外的位向量或布隆过滤器。每个位表示文档与用户或一组类似用户的相关性。相关性信息源自数据挖掘算法。我不确定这是否是最佳解决方案(同时实施起来便宜)。
任何建议/评论都将受到高度赞赏!谢谢!
答案 0 :(得分:1)
您可以添加表示匹配组/用户的字段,并提升各个值。例如,文件“马和蝴蝶”的字段组将具有增强的令牌组:“女学生”^ 10组:“骑自行车的人”^ - 1而文档“公路马”将具有增强的令牌组:“女学生“^ 2组:”骑自行车的人“^ 10。如果你是骑自行车的人,搜索马匹将首先返回公路马匹,如果你是女学生,则首先返回蝴蝶。