字符串hashCode()文档与实现

时间:2018-05-03 18:05:58

标签: java string java-8 hashcode

以下是来自Java 8的String.hashCode()方法的源代码片段(准确地说是1.8.0_131)

/**
 * Returns a hash code for this string. The hash code for a
 * {@code String} object is computed as
 * <blockquote><pre>
 * s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
 * </pre></blockquote>
 * using {@code int} arithmetic, where {@code s[i]} is the
 * <i>i</i>th character of the string, {@code n} is the length of
 * the string, and {@code ^} indicates exponentiation.
 * (The hash value of the empty string is zero.)
 *
 * @return  a hash code value for this object.
 */
public int hashCode() {
    int h = hash;
    if (h == 0 && value.length > 0) {
        char val[] = value;

        for (int i = 0; i < value.length; i++) {
            h = 31 * h + val[i];
        }
        hash = h;
    }
    return h;
}

您可以看到,文档说明hashCode()是使用以下公式计算的

s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]

虽然实际执行情况不同

for (int i = 0; i < value.length; i++) {
    h = 31 * h + val[i];
}

我错过了任何明显的事情吗?请帮帮我。

2 个答案:

答案 0 :(得分:10)

实现是正确的,但需要注意整数溢出可能发生(这里没问题,它不会伤害任何东西)。它使用Horner's method进行多项式求值。

以下是示例字符串&#34; CAT&#34;。

的步骤
h = 0

第一循环:

i = 0
h = 31 * 0 + 'C' (67) = 67

第二次循环:

i = 1
h = 31 * 67 + 'A' (65) = 2142

第三循环:

i = 2
h = 31 * 2142 + 'T' (84) = 66486

让我们从代码中推导出公式。这里, n 是字符串 s i的索引。 for循环的每次迭代都执行此公式。

h n = 31h n-1 + s n

h0 /* after loop i = 0 */ = s[0]
h1 /* after loop i = 1 */ = 31*h0 + s[1] = 31*s[0] + s[1]
h2 /* after loop i = 2 */ = 31*h1 + s[2] = 31*(31*s[0] + s[1]) + s[2]
h = 31*31*s[0] + 31*s[1] + s[2]

你看到31的幂的指数出现是因为在添加下一个字符的值之前,每个循环乘以另一个因子31

答案 1 :(得分:5)

最容易看到一些例子会发生什么。让我们取一个长度为s的字符串n和所有符号,如上所述。我们将分析迭代的循环迭代。我们将在当前迭代开始时调用h_oldh,并在当前迭代结束时调用h_newh。很容易看到h_new迭代i将是h_old的迭代i + 1

╔═════╦════════════════════════════╦═════════════════════════════════════════════════╗
║ It. ║ h_old                      ║ h_new                                           ║
╠═════╬════════════════════════════╬═════════════════════════════════════════════════╣
║ 1   ║ 0                          ║ 31*h_old + s[0] =                               ║
║     ║                            ║          s[0]                                   ║
║     ║                            ║                                                 ║
║ 2   ║ s[0]                       ║ 31*h_old + s[1] =                               ║
║     ║                            ║ 31      *s[0] +          s[1]                   ║
║     ║                            ║                                                 ║
║ 3   ║ 31  *s[0] +    s[1]        ║ 31^2    *s[0] + 31      *s[1] +    s[2]         ║
║     ║                            ║                                                 ║
║ 4   ║ 31^2*s[0] + 31*s[1] + s[2] ║ 31^3    *s[0] + 31^2    *s[1] + 31*s[2] + s[3]  ║
║ :   ║ :                          ║ :                                               ║
║ n   ║ ...                        ║ 31^(n-1)*s[0] + 31^(n-2)*s[1] + ... + 31^0*s[n] ║
╚═════╩════════════════════════════╩═════════════════════════════════════════════════╝

(使用Senseful生成的表)

31的权力是通过循环和h31的常数乘法(利用乘法的distributivity)创建的。 正如您在表格的最后一行中所看到的,这正是文档所说的那样。