Solr按固定长度拆分文本字段并存储在多个CopyFields中

时间:2018-01-03 03:40:55

标签: solr

所有 我们将Solr中的形状数据存储为RPT数据类型,但我们还需要使用数据执行自定义函数。但要做到这一点,我们需要docValues,所以我们将数据复制到copyfield。使用lucene docValues有3​​2K限制。因此,我们需要将数据分成32000个字符并将它们存储在3个副本字段中。由于其他原因,复制字段更好。

如何在不编写自定义updateRequest代码的情况下实现此目的..?有没有办法使用tokenizer来做到这一点?

1 个答案:

答案 0 :(得分:0)

您可以在copyField上截断,但不能抓住中间部分。

相反,你可以使用UpdateRequestProcessors并结合几个CloneField和RegexReplace处理器来获得你想要的东西。