什么是多标记字符串?

时间:2014-06-23 08:20:24

标签: string elasticsearch mapping token kibana

在github上浏览Elasticsearch问题并遇到this comment说明:

  

多个令牌字符串字段不能由任何Elasticsearch排序   可预测的方式。

作为参考,我们在这里谈论一个字符串时间戳,形式为" 14/05 / 08-13:41:23"。

从上下文中,我会假设任何非字母数字字符串(除了[A-Za-z0-9]之外的其他字符)都是多标记字符串?

1 个答案:

答案 0 :(得分:1)

好吧我误解了它是关于字符串的一般概念,我不知道,但它似乎实际上是Elasticsearch特定的术语:

默认情况下,当处理映射为字符串的字段时,ElasticSearch会解析它们并尝试将它们分成多个标记,而包含/的字符串似乎就是这种情况。结果,这些字符串变成“多令牌字符串”。为避免这种情况,需要编辑ElasticSearch的映射并将字段设置为“not_analyzed”,例如:

"my_field2": { "type": "string", "index": "not_analyzed" }

请参阅herethere以供参考。