首先,我应该透露我是Lucidworks Fusion的产品经理。
您似乎已经意识到Fusion使用Solr(或一个或多个Solr集群或实例),使用Solr进行数据存储和查询。 Fusion的目的是使Solr更容易使用,集成Solr,并构建使用Solr的复杂解决方案。 Fusion提供的一些许多人认为有用的东西包括:
- 连接器和连接器框架。 Bare Solr为您提供了良好的API,并能够在命令行中推送某些类型的文件。 Fusion附带了几个预构建的数据源连接器,可以从各种类型的系统中获取数据,并在适当时处理它们(包括解析,转换和字段映射),并将结果发送给Solr。这些连接器包括通用文档存储(云和内部部署),关系数据库,NoSQL数据存储,HDFS,企业应用程序以及功能强大且可配置的Web爬网程序。
- 安全集成。 Solr没有任何身份验证或授权(虽然从本周的5.2版本开始,它确实有一个可插入的API和用于身份验证的Kerberos的基本实现)。 Fusion使用安全版本包装Solr API。 Fusion具有与LDAP,Active Directory和Kerberos的完全集成,可用于身份验证。它还有一个细粒度的授权模型,用于管理和配置Fusion和Solr。并且,Fusion授权模型可以自动将来自LDAP / AD的组成员资格与来自Fusion Connectors数据源的访问控制列表相链接,以便在运行搜索查询时从源系统中镜像文档级访问控制。
- 管道处理模型。 Fusion提供了具有模块化阶段(API和GUI形式)的管道模型,以便更轻松地定义和编辑数据和文档的转换。它类似于unix shell管道。例如,在编写索引时,您可以包括用于定义字段映射的阶段,计算新字段,聚合文档,从其他来源提取数据等,然后再写入Solr。查询时,您可以执行相同的操作,同时转换查询,运行和返回其他分析的结果,以及应用安全过滤。
- Admin GUI。 Fusion具有用于查看和配置上述内容的Web UI(以及基本Solr配置)。我们认为这对于想要使用Solr的人来说很方便,但是不要经常使用它来记住如何使用API,配置文件和命令行工具。
- 基于搜索的复杂功能:使用上述管道模型,Fusion包含(并且易于使用)一些更丰富的基于搜索的组件,包括:自然语言处理和实体提取模块;实时信号驱动的相关性调整。我们打算将来提供更多这些。
- 分析处理:Fusion包含并集成了Apache Spark,可针对存储在Solr中(或进入Solr的数据)运行深度分析。虽然Solr隐含地包含某些数据分析功能,但这不是其主要目的。我们使用Apache Spark来驱动Fusion的信号提取和相关性调优,并期望公开API,以便用户可以轻松地在那里进行其他处理。
- 其他:许多有用的杂项功能,如:仪表板UI;具有手动相关性调整的基本搜索UI;更容易监控;工作管理和调度;通过电子邮件集成实时提醒等等。
当然很多都可以在没有Fusion的情况下针对Solr构建或编写,但我们认为提供这些类型的企业集成对许多人来说都是有价值的。