我有一个Elasticsearch v2.4.1索引,我在其中存储来自JSON提要的值。有时我会在某些字段中使用空格分隔值,例如:
"titulo" : "E l a ñ o q u e e l m e r c a d o d e j ó d e a s u s t a r"
大约15%的时间都会发生这种情况并阻止查询,例如:
localhost:9200/indice/_search?q=titulo:mercado
匹配上述文件。
我认为问题可以通过使用某种CharFilter来解决,我想到了N-gram滤波器,但事实恰恰相反。我知道这可能很复杂,因为ES应该在某种程度上推断语言(或者我可以指定它);处理含糊不清等问题......
同样的另一个例子:
"title" : "El g a l a r d ó n se e n t r e g a r á el p r ó x i m o día 2 4"
"title" : "G a m a a c t u a l i z a d a d e b o m b a s d e calor A q u a t e r m i c"
"title" : "K a s p e r s k y : m á s q u e a n t i v i r u s"