我创建了一个solr字段,如下所示:
<analyzer type="index">
<tokenizer class="solr.LowerCaseTokenizerFactory"/>
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
<filter class="solr.ShingleFilterFactory" minShingleSize="3" maxShingleSize="5"/>
<filter class="solr.PatternReplaceFilterFactory" pattern=".*_.*" replacement=""/>
</analyzer>
它会产生带有预期结果的文档带状疱疹。我想获得我无法找到的特定过滤器查询的所有带状疱疹。我尝试使用luke来获取索引但是,它给了我所有的带状疱疹而不是来自过滤器查询。有没有办法获得这样的数据?
答案 0 :(得分:0)
通过该字段进行分区将为您提供所有令牌以及令牌发生次数的计数。这可能就足够了。
如果您这样做是为了测试个别输入,您也可以在Web Admin UI的分析屏幕中尝试它。