希望solr只用c#查找每个文档

时间:2014-05-12 12:22:25

标签: solr solr4

我相信标记符会删除哈希值,只留下c,所以它会显示每个包含c的文档。我想知道如何阻止散列标记的条带化。我是否必须编写不同的标记器,或者是否有更简单的解决方案?

1 个答案:

答案 0 :(得分:0)

这是一件非常容易的事情,有许多不同的方法可以实现这一目标。我建议你在开始之前参考以下文章来了解Solr分析仪等方面的知识。

要回答你的问题,你可以停止剥离"#"使用WhitespaceTokenizerFactory为分析在solr模式中定义字段类型的字符。该字段将如此...

<fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100">
  <analyzer>
    <tokenizer class="solr.WhitespaceTokenizerFactory"/>
  </analyzer>
</fieldType>

有关详细信息,请参阅以下文章。

  1. https://cwiki.apache.org/confluence/display/solr/Understanding+Analyzers%2C+Tokenizers%2C+and+Filters
  2. Solr search for hashtag or mentions