我有类似的字符串,我想聚合, 但最后他们似乎在几个角色中是不同的。
例如:
doc1: {"message":"hello world and good morning1 300"}
doc2: {"message":"hello world and good morning1 200"}
doc3: {"message":"hello world and good morning1 100"}
我希望在聚合中得到这个结果:
"hello world and good morning1" - count: 3
当前使用默认分析器定义的字段
不过,是否有可能识别出更复杂的字符串,例如:doc3: {"message":"500 hello world and good morning1 100"}
提前多多感谢!
修改
实际数据是网址: 示例可以是:" www.domain.com/a/b/c/123456-d-sadf-asdf/collect"和" www.domain.com/a/b/c / pio-rddddd-fffff / collect",我们希望结果如下:www.domain.com/a/b/c/*/collect。意思是计算所有"无意义的"网址为1有意义。
Lior