在apache Solr中,为什么我们总是需要在文本字段上更喜欢字符串字段,如果两者都解决了目的?
字符串或文本如何影响索引大小,索引读取,索引创建等参数?
答案 0 :(得分:97)
solr架构中定义的默认字段非常不同。
String
将单词/句子存储为精确字符串而不执行标记化等。通常用于存储精确匹配,例如,用于分面。
Text
通常执行标记化和二次处理(例如下壳等)。当我们想要匹配句子的一部分时,适用于所有场景。
如果以下示例"This is a sample sentence"
已被索引到这两个字段,我们必须准确搜索文本This is a sample sentence
才能从string
字段获得匹配,而搜索可能就足够了对于sample
(或甚至samples
启用了stemmning)来获取text
字段的匹配。
答案 1 :(得分:0)
添加到 Johans Sjöbergs 的好答案:
您可以对 String
进行排序,但不能对 Text
进行排序。