使用Solr索引不同类型的文档

时间:2019-04-02 19:12:35

标签: solr solrj solrcloud solr4

我需要索引不同类型的JSON文档,每个JSON文档可以采用任何格式,可能具有嵌套的JSON对象(没有控件)。一旦完成索引编制,就应该能够进行搜索。由于我们没有对JSON文档架构或格式的控制权,因此决定使用无架构选项。遇到以下问题:

  • 由于updateProcessor'AddSchemaFieldsUpdateProcessorFactory'中的配置,所有值都将转换为list。
    • 例如:String数据类型被映射到text_general,设置为multiValued = true。
    • 如果我在托管模式中定义了该字段,那很好。
    • 输入:{"firstname":"ASGASGKSAJHAJS"}输出:{"firstname":["ASGASGKSAJHAJS"]}
  • 所有嵌套文档都将转换为平面结构
  • {"firstname":"ASGASGKSAJHAJS", "address":{"addressLine1":"4216 jshakjfhajh"}}正在转换为 {"firstname":"ASGASGKSAJHAJS", "address.addressLine1":"4216 jshakjfhajh"}

我试图盲目索引任何类型(例如JSON格式)的文档。当我搜索期望响应的格式与请求相同(索引编制时),而Solr配置更改最少。目前,我仅处理JSON,这是索引PDF的下一个要求。对于我的用例,Solr是正确的选择,还是我应该看看其他选择?

我是Solr的新手,它遍历了文档和文章,没有找到解决上述问题的最简单方法。任何指导将不胜感激。

0 个答案:

没有答案