我们正在处理Elasticsearch中的数据集,该数据集包含文本字符串中的数字值以及Alpha数值。使用标准令牌生成器进行分析可获得以下预期结果:
查询:
Home
结果:
GET /catalog/_analyze
{
"tokenizer": "standard" ,
"text": ["4\" Seamless Pipe"]
}
我的问题:
执行搜索时,是否有办法增强包含相同数值的结果? (这个数字也可能只是个零头,似乎在标记化过程中会引起另一组问题)。
任何有关如何处理此类数据的建议都将受到赞赏。