Hibernate Search - 修改StandardTokenizerFactory以连接所有单词

时间:2013-11-05 22:42:57

标签: java solr lucene tokenize hibernate-search

我在我的Hibernate类中使用StandardTokenizerFactory作为我的@TokenizerDef。我想保持StandardTokenizerFactory标记单词的方式,但添加另一个规则来通过连接(明确删除所有空格)字段中的所有单词来创建标记。

实现我想要的最简单的方法或替代方法是什么?

1 个答案:

答案 0 :(得分:0)

我认为您需要的是过滤器链中的另一个令牌过滤器(工厂)。你看过ShingleFilterFactory了吗?它做了非常相似的事情,可以配置令牌分隔符。不确定它是否也可以是空字符串。如果没有别的,你可以根据ShingleFilterFactory编写自己的ConcatenatingFilterFactory。