将WordDelimiterFilter
与generateNumberParts
一起使用我可以使用类似“123-456”的字符串并将其编入索引,以便“123”的查询匹配。
我还想做的是将前导零处理为另一个部分生成转换。换句话说,“000123”应该生成“123”作为标记以及“000123”,就像我开始使用“000-123”一样。
我可以使用PatternReplaceFilter
删除前导零,但我真正想做的是拆分前导零后的字符串,而不是将它们扔掉。
这样做的好方法是什么?
如果过滤器实际导致修改,是否更容易破解PatternReplaceFilter以索引原始令牌?或者破解WordDelimiterFilter以确认前导零?