如何在hibernate搜索中将多个单词索引为单个标记?

时间:2012-05-07 12:21:44

标签: search solr lucene tokenize

我在我的项目中使用带有solr的hibernate搜索,我的一个用例需要对数据进行标记化和索引,如下所示:

我的一个数据库字段是varchar并且具有值:New Road,Kings方式(用逗号分隔)

我希望新道路和国王的方式被用作代币,而不是新的,道路,国王和方式,这样当我搜索等等等等等等等等等等等等等等等,它会显示新道路的结果,如果是搜索文本包含新书,新道路的结果将不会显示。

提前致谢

1 个答案:

答案 0 :(得分:2)

您可以使用solr.PatternTokenizerFactory对该字段进行标记和搜索 http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters