我正在解决一个问题,我遇到执行时间变得太大的问题,现在我正在寻找可能的优化。
问题:使用String或Integer作为haskey之间的性能是否有任何(相当大的)差异?
问题是我有一个图表,节点存储在一个以String为键的哈希表中。例如,键如下 - “0011”或“1011”等。现在我可以将它们转换为整数,如果这意味着执行时间的改善。
答案 0 :(得分:3)
整数将比String更好。以下是两者的哈希码计算代码。
整数哈希码实现
/**
* Returns a hash code for this <code>Integer</code>.
*
* @return a hash code value for this object, equal to the
* primitive <code>int</code> value represented by this
* <code>Integer</code> object.
*/
public int hashCode() {
return value;
}
字符串哈希码实现
/**
* Returns a hash code for this string. The hash code for a
* <code>String</code> object is computed as
* <blockquote><pre>
* s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
* </pre></blockquote>
* using <code>int</code> arithmetic, where <code>s[i]</code> is the
* <i>i</i>th character of the string, <code>n</code> is the length of
* the string, and <code>^</code> indicates exponentiation.
* (The hash value of the empty string is zero.)
*
* @return a hash code value for this object.
*/
public int hashCode() {
int h = hash;
if (h == 0) {
int off = offset;
char val[] = value;
int len = count;
for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;
}
return h;
}
答案 1 :(得分:2)
如果遇到性能问题,则问题不太可能是HashMap / HashTable引起的。虽然散列字符串比散列整数略贵,但它的差异相当小,而且hashCode被缓存,因此如果使用相同的字符串对象则不会重新计算,您不可能通过首先将其转换为整数来获得任何显着的性能优势。
在其他地方寻找性能问题的根源可能会更有成效。您是否尝试过分析代码?
答案 2 :(得分:1)
速度有所不同。 HashMaps将使用hashCode根据该代码计算存储桶,并且Integer的实现比String的实现简单得多。
话虽如此,如果您遇到执行时间问题,您需要自己进行一些正确的测量和分析。这是找出问题与执行时间有关的唯一方法,使用Integers而不是字符串通常只会对性能产生最小影响,这意味着您的性能问题可能在其他地方。
例如,如果您想要做一些适当的微基准测试,请查看this post。还有许多其他资源可用于分析等。