类似字符串的聚合

时间:2016-01-10 11:08:02

标签: elasticsearch aggregation

我有类似的字符串,我想聚合, 但最后他们似乎在几个角色中是不同的。

例如:

doc1: {"message":"hello world and good morning1 300"} 
doc2: {"message":"hello world and good morning1 200"} 
doc3: {"message":"hello world and good morning1 100"} 

我希望在聚合中得到这个结果:

"hello world and good morning1" - count: 3 

当前使用默认分析器定义的字段

不过,是否有可能识别出更复杂的字符串,例如:

doc3: {"message":"500 hello world and good morning1 100"} 

提前多多感谢!

修改

实际数据是网址: 示例可以是:" www.domain.com/a/b/c/123456-d-sadf-asdf/collect"和" www.domain.com/a/b/c / pio-rddddd-fffff / collect",我们希望结果如下:www.domain.com/a/b/c/*/collect。意思是计算所有"无意义的"网址为1有意义。

Lior

0 个答案:

没有答案