我们要求结构化和非结构化数据都进入系统。我们需要为它们编制索引,然后在其上启用搜索功能。我们在Hadoop平台上使用SolrCloud。对于结构化数据,我们计划将数据放入HBase,将非结构化数据直接放入HDFS。
我的问题是如何在单个Solr核心下索引这些来源?是否可以在SolrCloud中的单个核心/集合下索引结构化和非结构化数据,然后在该索引上启用搜索功能?
提前致谢。
答案 0 :(得分:1)
您最多可以拥有一个Solr架构,其中包含所有可能的字段名称,即结构化和非结构化数据。另请注意,因为您提到了非结构化,您可以在现有模式文件中附加更多字段名称。如果你不能添加字段,那么你需要考虑其他一些方法来实现它。
因此,对于结构化数据,您只需填充特定于结构化数据的字段值,并保持其余字段不变。
对于Solr中的单个核心和索引,上面说明的实际上是如何使不同的文档具有不同的结构。
如果你在问题上有不同的意思,请回复我。