在Ruby中,查明字符串是否在数组中(.include? x
)非常慢。如果您将该数组更改为一个集合,则 BAM ,快速查找闪电。
在JavaScript中,没有集合,数组查找(.indexOf(x) >= 0
)也非常慢,但我需要在脚本中执行10,000次这些查找。
我的Ruby版本(带有集合)在0.125
秒内运行,我的JavaScript版本(在NodeJS中)需要29
!
是否有任何设置库或更好的方法来执行可以在Ruby附近获得Javascript速度的数组查找?
编辑:将“对象”更改为“字符串”以清除任何混淆
答案 0 :(得分:12)
首先,这里有一些基本的混淆,即JavaScript中可用的数据结构。
JavaScript没有数组
从根本上说,JavaScript只有哈希表。标准Array
函数构造散列表(我将称之为整数散列表或 int-hash-tables ),其中键是整数字符串键。这些执行与数组类似,但它们在某些方面有所不同。有缺点和优点。例如,从int-hash-table中删除元素是O(1)操作,而从数组中删除元素是O(n)操作(因为您需要将其余元素复制到新数组中)。这就是JavaScript中Array.prototype.splice
函数非常快的原因。缺点是实施的复杂性。
所以,当你在JavaScript上下文中说Array
时,它被理解为int-hash-table,以及与之相关的所有渐近复杂性。这意味着如果要在int-hash-table中找到字符串 value ,那么它将是一个O(n)操作。这样做有一个标准功能:Array.prototype.indexOf
。但是,如果您想查找键,则有两个功能:in
和Object.prototype.hasOwnProperty
。
有些违反直觉:
[1, 2, 3].hasOwnProperty(0); // true
0 in [1, 2, 3]; // true
两者之间的差异需要进一步解释。它与JavaScript中的所有东西都是对象这一事实有关,因此它们具有一些对象特征。其中一个特征是prototype
,即对象与其原型之间的链接。它是散列表的层次结构,每个都包含对象的属性。
in
查找对象的直接哈希表,然后递归搜索此对象原型的哈希表。
Object.prototype.hasOwnProperty
只查看立即哈希表。你可能认为它应该更快,但等待跳到结论。
由于JavaScript的动态特性,所有函数调用都是动态的,环境必须非常小心,以确保代码执行的故障安全。这意味着在JavaScript中函数调用非常昂贵。因此,经过Object.prototype.hasOwnProperty
可能比通过in
要贵得多,即使理论上它应该相反。但是,给定足够高的继承树和足够的继承属性,最终Object.prototype.hasOwnProperty
将接管。
获得更好直觉的一些例子:
>>> var array = [1, 2, 3];
undefined
>>> 3 in array;
false
>>> array.hasOwnProperty(3);
false
>>> 3 in array;
false
>>> array.__proto__ = [1, 2, 3, 4];
[1, 2, 3, 4]
>>> 3 in array;
true
>>> array.hasOwnProperty(3);
false
<强> TL; DR 强>
如果您希望对具有短原型继承链的对象进行最快的键查找,请使用in
。
如果您想要相同,但对于具有广泛继承链的对象,请使用Object.prototype.hasOnwProperty
如果您想要最快的值查找,请Array.prototype.indexOf
使用Array
。
散列表中没有用于值查找的内置函数。当然,您可以自己动手,但有许多库已经提供了一个。例如,Underscore提供一个(它称之为indexOf
)。
答案 1 :(得分:6)
来自@nnnnnn的评论:
将数组转换为对象,如下所示:
object = {}
array.forEach(function(string) { // Not cross-browser compatible, it's just an example
object[string] = 1;
}
然后执行这样的查找:
if (string in object) {