solr - 使用Lucidworks Fusion而不是常规Solr的利弊

首先，我应该透露我是Lucidworks Fusion的产品经理。

您似乎已经意识到Fusion使用Solr（或一个或多个Solr集群或实例），使用Solr进行数据存储和查询。 Fusion的目的是使Solr更容易使用，集成Solr，并构建使用Solr的复杂解决方案。 Fusion提供的一些许多人认为有用的东西包括：

连接器和连接器框架。 Bare Solr为您提供了良好的API，并能够在命令行中推送某些类型的文件。 Fusion附带了几个预构建的数据源连接器，可以从各种类型的系统中获取数据，并在适当时处理它们（包括解析，转换和字段映射），并将结果发送给Solr。这些连接器包括通用文档存储（云和内部部署），关系数据库，NoSQL数据存储，HDFS，企业应用程序以及功能强大且可配置的Web爬网程序。
安全集成。 Solr没有任何身份验证或授权（虽然从本周的5.2版本开始，它确实有一个可插入的API和用于身份验证的Kerberos的基本实现）。 Fusion使用安全版本包装Solr API。 Fusion具有与LDAP，Active Directory和Kerberos的完全集成，可用于身份验证。它还有一个细粒度的授权模型，用于管理和配置Fusion和Solr。并且，Fusion授权模型可以自动将来自LDAP / AD的组成员资格与来自Fusion Connectors数据源的访问控制列表相链接，以便在运行搜索查询时从源系统中镜像文档级访问控制。
管道处理模型。 Fusion提供了具有模块化阶段（API和GUI形式）的管道模型，以便更轻松地定义和编辑数据和文档的转换。它类似于unix shell管道。例如，在编写索引时，您可以包括用于定义字段映射的阶段，计算新字段，聚合文档，从其他来源提取数据等，然后再写入Solr。查询时，您可以执行相同的操作，同时转换查询，运行和返回其他分析的结果，以及应用安全过滤。
Admin GUI。 Fusion具有用于查看和配置上述内容的Web UI（以及基本Solr配置）。我们认为这对于想要使用Solr的人来说很方便，但是不要经常使用它来记住如何使用API，配置文件和命令行工具。
基于搜索的复杂功能：使用上述管道模型，Fusion包含（并且易于使用）一些更丰富的基于搜索的组件，包括：自然语言处理和实体提取模块;实时信号驱动的相关性调整。我们打算将来提供更多这些。
分析处理：Fusion包含并集成了Apache Spark，可针对存储在Solr中（或进入Solr的数据）运行深度分析。虽然Solr隐含地包含某些数据分析功能，但这不是其主要目的。我们使用Apache Spark来驱动Fusion的信号提取和相关性调优，并期望公开API，以便用户可以轻松地在那里进行其他处理。
其他：许多有用的杂项功能，如：仪表板UI;具有手动相关性调整的基本搜索UI;更容易监控;工作管理和调度;通过电子邮件集成实时提醒等等。

当然很多都可以在没有Fusion的情况下针对Solr构建或编写，但我们认为提供这些类型的企业集成对许多人来说都是有价值的。

使用Lucidworks Fusion而不是常规Solr的利弊

1 个答案: