全文个性化搜索产品

时间:2011-08-08 17:55:29

标签: search full-text-search nlp information-retrieval

支持全文个性化搜索的全文搜索技术是什么?

例如,在您选择的网络邮件提供商中联系搜索:它是全文,但只搜索您的个人联系人而不是整个联系人。

有无数的全文搜索包,但我不知道如何使用大多数全文搜索包,这样每个用户只能看到文档世界的一小部分。

2 个答案:

答案 0 :(得分:0)

对于电子邮件,它很简单:使用任何流行的搜索工具包并为每个用户构建索引。这很简单,因为索引不应该重叠,或者你违反了用户的隐私。此外,重叠可能会扭曲像IDF这样的数字。 (您可能只想将发送给多个用户的电子邮件编入索引一次,但这对安全和隐私的影响是不值得的。磁盘很便宜。)

如果常见的文档集合应该被编入索引以进行个性化搜索,那么我恐怕是你自己的。

答案 1 :(得分:0)

我建议使用contact_list_id,usage_freuency等特殊字段构建所有联系人的lucene索引。在搜索每个用户时,添加他们的特定参数,即文本:“John smith”AND contact_list_id:“$ current_user_id”按usege_freuency排序。在这种情况下,您将优化索引在一个位置压缩的所有数据,并且还可以通过像usage_freuency或更强大的排名等字段进行个性化。将索引视为DB,通过文本进行高效搜索。