我想了解设置solr架构以在数据中搜索“#10”之类的最佳方法。
感谢。
答案 0 :(得分:1)
你的问题实际上有很多,我会这样分解:
如果不回答这些问题,就无法确定您的架构设计。
这些问题是一个更长的话题,所以我不打算在这里看到那些令人讨厌的事情(请阅读Solr文档以获得更多理解。)
在处理特殊字符时,您关心的是索引中的分析步骤,因为您希望以允许逻辑检索它们的方式存储您的术语。分析人员(可以)使用各种标记化策略将词干修改应用于索引内容。
分析人员正在打破术语文本;你需要确保你的特殊角色能够在分析中存活下来并最终被编入索引。我将开始使用WhitespaceAnalyzer查看,它将源内容中的术语保留在索引中的确切状态。 Solr wiki page on Analyzers会让您了解其中有多少功能。