我相信标记符会删除哈希值,只留下c,所以它会显示每个包含c的文档。我想知道如何阻止散列标记的条带化。我是否必须编写不同的标记器,或者是否有更简单的解决方案?
答案 0 :(得分:0)
这是一件非常容易的事情,有许多不同的方法可以实现这一目标。我建议你在开始之前参考以下文章来了解Solr分析仪等方面的知识。
要回答你的问题,你可以停止剥离"#"使用WhitespaceTokenizerFactory为分析在solr模式中定义字段类型的字符。该字段将如此...
<fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
</analyzer>
</fieldType>
有关详细信息,请参阅以下文章。