我在我的项目中使用带有solr的hibernate搜索,我的一个用例需要对数据进行标记化和索引,如下所示:
我的一个数据库字段是varchar并且具有值:New Road,Kings方式(用逗号分隔)
我希望新道路和国王的方式被用作代币,而不是新的,道路,国王和方式,这样当我搜索等等等等等等等等等等等等等等等,它会显示新道路的结果,如果是搜索文本包含新书,新道路的结果将不会显示。
提前致谢
答案 0 :(得分:2)
您可以使用solr.PatternTokenizerFactory
对该字段进行标记和搜索
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters