快速查找字符串是否在数组中的方法

时间:2013-10-20 09:54:45

标签: javascript arrays set

在Ruby中,查明字符串是否在数组中(.include? x)非常慢。如果您将该数组更改为一个集合,则 BAM ,快速查找闪电。

在JavaScript中,没有集合,数组查找(.indexOf(x) >= 0)也非常慢,但我需要在脚本中执行10,000次这些查找。

我的Ruby版本(带有集合)在0.125秒内运行,我的JavaScript版本(在NodeJS中)需要29

是否有任何设置库或更好的方法来执行可以在Ruby附近获得Javascript速度的数组查找?

编辑:将“对象”更改为“字符串”以清除任何混淆

2 个答案:

答案 0 :(得分:12)

首先,这里有一些基本的混淆,即JavaScript中可用的数据结构。

JavaScript没有数组

从根本上说,JavaScript只有哈希表。标准Array函数构造散列表(我将称之为整数散列表 int-hash-tables ),其中键是整数字符串键。这些执行与数组类似,但它们在某些方面有所不同。有缺点和优点。例如,从int-hash-table中删除元素是O(1)操作,而从数组中删除元素是O(n)操作(因为您需要将其余元素复制到新数组中)。这就是JavaScript中Array.prototype.splice函数非常快的原因。缺点是实施的复杂性。

所以,当你在JavaScript上下文中说Array时,它被理解为int-hash-table,以及与之相关的所有渐近复杂性。这意味着如果要在int-hash-table中找到字符串 value ,那么它将是一个O(n)操作。这样做有一个标准功能:Array.prototype.indexOf。但是,如果您想查找,则有两个功能:inObject.prototype.hasOwnProperty

有些违反直觉:

[1, 2, 3].hasOwnProperty(0); // true
0 in [1, 2, 3]; // true

两者之间的差异需要进一步解释。它与JavaScript中的所有东西都是对象这一事实有关,因此它们具有一些对象特征。其中一个特征是prototype,即对象与其原型之间的链接。它是散列表的层次结构,每个都包含对象的属性。

  • in查找对象的直接哈希表,然后递归搜索此对象原型的哈希表。

  • Object.prototype.hasOwnProperty只查看立即哈希表。你可能认为它应该更快,但等待跳到结论。

由于JavaScript的动态特性,所有函数调用都是动态的,环境必须非常小心,以确保代码执行的故障安全。这意味着在JavaScript中函数调用非常昂贵。因此,经过Object.prototype.hasOwnProperty可能比通过in要贵得多,即使理论上它应该相反。但是,给定足够高的继承树和足够的继承属性,最终Object.prototype.hasOwnProperty将接管。

获得更好直觉的一些例子:

>>> var array = [1, 2, 3];
undefined
>>> 3 in array;
false
>>> array.hasOwnProperty(3);
false
>>> 3 in array;
false
>>> array.__proto__ = [1, 2, 3, 4];
[1, 2, 3, 4]
>>> 3 in array;
true
>>> array.hasOwnProperty(3);
false

<强> TL; DR

  • 如果您希望对具有短原型继承链的对象进行最快的键查找,请使用in

  • 如果您想要相同,但对于具有广泛继承链的对象,请使用Object.prototype.hasOnwProperty

  • 如果您想要最快的值查找,请Array.prototype.indexOf使用Array

  • 散列表中没有用于值查找的内置函数。当然,您可以自己动手,但有许多库已经提供了一个。例如,Underscore提供一个(它称之为indexOf)。

答案 1 :(得分:6)

来自@nnnnnn的评论:

将数组转换为对象,如下所示:

object = {}
array.forEach(function(string) { // Not cross-browser compatible, it's just an example
  object[string] = 1;
}

然后执行这样的查找:

if (string in object) {