我目前使用较旧版本的Solr - 4.7.2。它以独立模式运行 - 只有一个具有多个内核的solr节点。每个核心都受到ldap组的保护。
我希望能够针对单个核心进行搜索,现在还可以在多个核心中添加搜索功能。由于分布式搜索被认为是遗留的,我相信SolrCloud必须成为现实。我在本地安装了最新版本的solr。
我一直在阅读这篇文章,但我仍然不确定如何做到这一点。
现在大约有100个核心。所有都具有相同的架构。
我是否将每个核心转换为一个集合,其中每个集合仍然受到ldap组的保护?然后你可以搜索多个集合吗?
或者您是否设置了一个具有多个核心的集合?每个核心然后是一个碎片,我仍然可以保护每个碎片?然后,用户可以在分片\核心内或集合中的所有内容中进行搜索?
如果您搜索多个集合或分片(取决于上面的方案是哪种方式)并且用户无权访问集合或分片,会发生什么?您是否需要提前了解用户可以搜索的时间,以便没有错误或者是否会绕过您无法访问的错误?
感谢您提供的任何见解。
答案 0 :(得分:0)
嗯,这里有很多要点。我们可以帮助您了解
我目前使用较旧版本的Solr - 4.7.2。它以独立模式运行 - 只有一个具有多个内核的solr节点。每个核心都受到ldap组的保护。
确定
我希望能够针对单个核心进行搜索,现在还可以在多个核心中添加搜索功能。由于分布式搜索被认为是遗留的,我相信SolrCloud必须成为现实。我在本地安装了最新版本的solr。我一直在阅读这篇文章,但我仍然不确定如何做到这一点。目前大约有100个核心。所有都具有相同的架构。 我是否将每个核心转换为一个集合,其中每个集合仍然受到ldap组的保护?然后你可以搜索多个馆藏吗?
这是一种可能的情况。我不确定LDAP auth是否仍然可以像您当前实现的那样工作,因为请记住,与SolrCloud的交互是不同的,它涉及第三个组件(Zookeeper),它在独立方案中不存在或者(手动)分布式搜索 从(可能我在这里错误的版本)Solr 5开始,/ admin端点还提供授权/认证API(基础AA机制,如LDAP,可以插入)
只有一个疑问:具有相同模式的100个核心意味着具有相同模式的100个集合,这可能意味着用于管理可以考虑的100个分布式Lucene索引的相关数量的资源。假设您目前只在一台服务器上(这意味着您没有大量数据)为什么不在一个集合中合并所有内容(添加额外的"来源&# 34;区分文件的领域)?
或者您是否设置了一个具有多个核心的集合?
在上面阅读,它基本上取决于你。你可以做到这两点。
每个核心是一个碎片,我仍然可以保护每个碎片?然后,用户可以在分片\核心内或集合中的所有内容中进行搜索?
考虑到你正在做的步骤,但考虑到你正在做的步骤是不正确的,是的,我认为这可以帮助你在一开始就理解事情是如何运作的。但是,我会看一下参考指南。 是的,客户可以在任何地方搜索,定位一个或多个集合。
如果您搜索多个集合或分片(取决于上面的方案是哪种方式)并且用户无权访问集合或分片,会发生什么?您是否需要提前了解用户可以搜索的时间,以便没有错误或者是否会绕过您无法访问的错误?
我认为您实际使用的身份验证保护完全是Solr的外部保护,所以我猜您的假设是正确的:您应事先知道给定用户可以去哪里,否则某些请求会返回403错误(或类似的东西)。