我必须在Solr中存储,编制索引并找到很多SHA1-Tokens。
现在我将它们存储为40-Chars-Hex-strings,如68ac906495480a3404beee4874ed853a037a7a8f
。我的Solr索引中有大约10,000多个独特的SHA1令牌。
将压缩后的值存储为20字节二进制字段会更好吗? (指数的一半,更多的表现......?)
我在“Lucene in action”手册中读到了Krugle,该手册只在<压缩的)MD5字符串中间存储一些字符。获得最大搜索性能会更好吗?