algorithm - 高斯分布+哈希表

我对哈希函数有一个奇怪的想法。问题陈述是

您存储的ID为162 班上的学生获得n分在一个课程中超过300（每个n = 0，哈希表中的1,2，... 300）。设计最简单，最不容易发生碰撞这样的哈希函数就是这样的浪费的记忆细胞也是最小的。在这里，碰撞是两个学生得分n ₁和 n ₂获得相同的插槽哈希表。

一种解决方案可以是使用h（n）=（n * 5 + 7）％163以及链接。最多可以有162个不同的标记。

编辑有几种标准方法可以做到这一点。但是我想尝试一下我的想法并检查它（也许是数学上的）。它可能与较小的记忆有较小的碰撞。

现在，这是我的想法。我可以假设标记分布为gaussian。因此，平均得分附近有更多人，而极端情况则更少。

所以，我可以使用这样的哈希函数：

h（n）= 0（如果n <100 || n> 200）   h（n）= 1（如果100 <= n <125 || 175 <= n <200）
  h（n）= 2（如果125 <= n <140 || 160 <= n <175）
  h（n）= 3（如果140 <= n <160）

对于某些此类条件（例如，k），哈希表将具有最少的冲突数和最少的占用空间。

现在，这只是猜测。这样的事情是否有意义？有没有办法证明这一点？或者我在某处错了？