我有一个名字的自定义分析器。我想给类似的变音符号更多的重量。这可能吗?
@Override
protected TokenStreamComponents createComponents(String fieldName, java.io.Reader reader) {
VERSION = Version.LUCENE_4_9;
final Tokenizer source = new StandardTokenizer(VERSION, reader);
TokenStream result = new StandardFilter(VERSION, source);
result = new LowerCaseFilter(VERSION, result);
result = new ASCIIFoldingFilter(result);
return new TokenStreamComponents(source, result);
}
示例查询: 输入:“ZurMühle” outpt(等分):“Zur Linde”,“Zur Muehle”。
当然,我想把“Zur Muehle”作为最佳结果。但是我怎么能告诉lucene更多地关注变音符号?
答案 0 :(得分:0)
这样做的一种方法是使用有效负载来增强包含变音符号的术语。如果您需要有关使用有效载荷的更多详细信息,请询问进一步的说明。