Solr Tokenizer Injection

时间:2011-08-25 18:53:07

标签: solr tokenize

作为一个例子,我有一个文本字段,可能包含以下字符串:

“d7199 ^^ == ^^ 81 ^^ == ^^一两句话!!”

我想对这些数据进行标记,但每个标记都包含字符串的第一部分。所以,我希望上面的示例中的标记看起来像这样:

“d7199 ^^ == ^^ 81 ^^ == ^^一个”

“d7199 ^^ == ^^ 81 ^^ == ^^句子”

“d7199 ^^ == ^^ 81 ^^ == ^^或”

“d7199 ^^ == ^^ 81 ^^ == ^^两个”

我将如何做到这一点?

1 个答案:

答案 0 :(得分:1)

您可以实现自己的自定义Tokenizer并将其添加到Solr类路径中。然后在Solr schema.xml和solrconfig.xml

中使用它