我正在寻找一个基于大小写更改分割文本的标记器。 例如。索引此文本:“HandMade”将索引指针并使得搜索手或制作将返回结果。
答案 0 :(得分:1)
WordDelimiterFilterFactory是您要使用的。它允许您分割大小写更改(以及字内分隔符和数字之类的内容,具体取决于您使用的参数)。请参阅此处的文档:https://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.WordDelimiterFilterFactory
在您的情况下,您应该使用splitOnCaseChange="1"
来获得您想要的内容。