Pattern Tokenizer Factory不使用否定正则表达式

时间:2013-04-17 12:02:30

标签: solr schema

我需要我的tokenizer工厂,分割所有期望数字,字母,&:和单引号字符。

我使用Solr.PatternTokenizerFactory,如下所示,

<tokenizer class="solr.PatternTokenizerFactory" pattern="[^a-zA-Z0-9&amp;-:]" />

但是,它的空间令牌仅限空间。不知道我在做错了什么。

任何人都可以帮我这个吗?

1 个答案:

答案 0 :(得分:2)

我弄错了,这是一个非常愚蠢的错误,我需要在我的模式中逃避-

更改为以下并开始工作

<tokenizer class="solr.PatternTokenizerFactory" pattern="[^a-zA-Z0-9&amp;\-:]" />