用于创建自己的令牌和字符过滤器的Solr文档说明如下。
http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#Specifying_an_Analyzer_in_the_schema
如果你想使用自定义CharFilters,Tokenizers或TokenFilters,你需要编写一个非常简单的工厂,它的子类是BaseTokenizerFactory或BaseTokenFilterFactory,就像这样......
public class MyCustomFilterFactory extends BaseTokenFilterFactory {
public TokenStream create(TokenStream input) {
return new MyCustomFilter(input);
}
}
我在Solr 4的源代码中找不到BaseTokenFilterFactory。
这是Solr 3.6.1的org.apache.solr.analysis软件包
这是Solr 4.0.0的相同软件包
文档看起来适用于Solr 3.6,但我需要知道如何使用4.0创建自定义过滤器。
答案 0 :(得分:7)
使用solr 4.0,BaseTokenFilterFactory
现在为org.apache.lucene.analysis.util.TokenFilterFactory
,因此您可以查看this。