我的问题的第一个背景。
问题涉及引入Lucene并执行仅返回匹配实体实例列表的搜索。然后我的代码需要逐个过滤实体。这种方法效率非常低,因为用户可能只能看到少数人,而检查许多人返回的少数人不太理想。
开发人员采用什么方法或如何解决这个问题 - 请记住使用Lucene执行索引和搜索?
修改
解释
索引
安全检查
答案 0 :(得分:7)
这取决于您的上下文中相关的不同安全组的数量以及安全性如何应用于索引数据。
我们遇到了类似的问题,我们通过以下方式解决了这个问题:索引时我们将允许的组添加到文档中,并且在搜索时我们添加了一个布尔查询,其中包含用户所属的组。这在我们的场景中表现良好。
答案 1 :(得分:3)
这取决于您的安全模型。如果权限很简单 - 比如你有三类文档 - 最好为每个类构建一个单独的Lucene索引,并在用户可以看到多个类时合并结果。 The Solr security Wiki建议类似于HakonB的建议 - 将用户的凭据添加到查询中并通过它们进行搜索。 另见this discussion in the Lucene user group。 另一个策略是将Lucene搜索包含在一个单独的安全类中,该安全类可以对Lucene进行额外的过滤。如果您可以使用数据库来执行此操作,则可能会更快。
编辑: 我发现你有一个相当复杂的权限系统。您的基本设计选择是在Lucene内部还是在Lucene外部实现它。我的建议是使用Lucene作为搜索引擎(它的主要优势)并使用另一个系统/应用程序来提高安全性。如果你选择使用Lucene来保证安全,我建议你好好学习Lucene Filters,并使用bitset过滤器来过滤查询的结果。它确实存在您列出的必须更新权限的问题。
答案 2 :(得分:0)
正如Yuval所说,可能值得拥有独立于lucene索引的权限机制。
实现此目的的一种方法是实施您自己的Collector
,这将过滤掉用户无权访问的结果。
答案 3 :(得分:0)
我建议有两种文件:
1)Real_documents,其字段名为:“DocumentID”
2)包含字段的安全文档:“Role”“Groups”“Users”“PermisionId”“DocumentsIds”
然后伪代码可能是:
Field[] docIds =searcher.search("Users", "currentUser").getFields("DocumentIds");
TermsFilter filter = new TermFilter();
foreach(field:docIDs){
filter.add(new Term(field.field(),field.text());
}
searcher.search(query.getWeight(searcher), filter, numberOfDocuments);
由于Lucene在搜索两个搜索时非常快,所以很容易制作。通过这种方式,您还可以为每个用户提供更好的tf-idf。