我在我的Hibernate类中使用StandardTokenizerFactory
作为我的@TokenizerDef
。我想保持StandardTokenizerFactory
标记单词的方式,但添加另一个规则来通过连接(明确删除所有空格)字段中的所有单词来创建标记。
实现我想要的最简单的方法或替代方法是什么?
答案 0 :(得分:0)
我认为您需要的是过滤器链中的另一个令牌过滤器(工厂)。你看过ShingleFilterFactory了吗?它做了非常相似的事情,可以配置令牌分隔符。不确定它是否也可以是空字符串。如果没有别的,你可以根据ShingleFilterFactory编写自己的ConcatenatingFilterFactory。