从solr doc(lucene,luke)检索分析的带状疱疹

时间:2015-08-30 14:50:06

标签: solr lucene solrj luke

我创建了一个solr字段,如下所示:

<analyzer type="index">
    <tokenizer class="solr.LowerCaseTokenizerFactory"/>              
    <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
    <filter class="solr.ShingleFilterFactory" minShingleSize="3" maxShingleSize="5"/>
    <filter class="solr.PatternReplaceFilterFactory" pattern=".*_.*" replacement=""/>
</analyzer>

它会产生带有预期结果的文档带状疱疹。我想获得我无法找到的特定过滤器查询的所有带状疱疹。我尝试使用luke来获取索引但是,它给了我所有的带状疱疹而不是来自过滤器查询。有没有办法获得这样的数据?

1 个答案:

答案 0 :(得分:0)

通过该字段进行分区将为您提供所有令牌以及令牌发生次数的计数。这可能就足够了。

如果您这样做是为了测试个别输入,您也可以在Web Admin UI的分析屏幕中尝试它。