如何将1亿个字符串映射到10万个int?

时间:2016-04-08 02:42:47

标签: algorithm hash redis

我有大约1亿个简单的键值对(它的遗留数据,永远不需要更新,键是随机字符串),我想将它们存储在redis中进行查询。

我的想法是我使用前四个字符作为哈希键,并将它们存储为哈希类型,因此redis中有大约一百万个哈希键,每个哈希键有大约1000个子键。 / p>

但事情并没有像计划那样进行。出于某种原因,我发现一些散列键只有一个子键,但有些子键有超过500,000个子键,这些子键可能无法在内存中高效编码。

所以我想知道有一些简单易懂的算法可以将我的1亿字符串平均分成10万个桶(int)。当我拿起一个字符串时,我可以通过使用相同的算法知道它在哪里。

谢谢!

0 个答案:

没有答案