Solr搜索非字母数字字符

时间:2011-04-07 15:06:09

标签: schema solr

我想了解设置solr架构以在数据中搜索“#10”之类的最佳方法。

感谢。

1 个答案:

答案 0 :(得分:1)

你的问题实际上有很多,我会这样分解:

  • 我需要搜索哪些数据字段?
  • 我将如何搜索这些字段?
  • 我需要从搜索请求中检索哪些数据?

如果不回答这些问题,就无法确定您的架构设计。

这些问题是一个更长的话题,所以我不打算在这里看到那些令人讨厌的事情(请阅读Solr文档以获得更多理解。)

在处理特殊字符时,您关心的是索引中的分析步骤,因为您希望以允许逻辑检索它们的方式存储您的术语。分析人员(可以)使用各种标记化策略将词干修改应用于索引内容。

分析人员正在打破术语文本;你需要确保你的特殊角色能够在分析中存活下来并最终被编入索引。我将开始使用WhitespaceAnalyzer查看,它将源内容中的术语保留在索引中的确切状态。 Solr wiki page on Analyzers会让您了解其中有多少功能。