Javascript数组稀疏吗?

时间:2009-10-02 17:09:09

标签: javascript sparse-matrix

也就是说,如果我使用当前时间作为数组的索引:

array[Date.getTime()] = value;

解释器会实例化从0到现在的所有元素吗?不同的浏览器会采用不同的方式吗?

我记得曾经是AIX内核中的一个错误,它会根据请求创建伪ttys,但如果你这样做,比如“echo> / dev / pty10000000000”它会创建/ dev / pty0,/ dev / pty1,....然后摔倒了。在贸易展览会上很有趣,但我不希望这发生在我的客户身上。

7 个答案:

答案 0 :(得分:62)

是的,他们是。它们实际上是内部的哈希表,因此您不仅可以使用大整数,还可以使用字符串,浮点数或其他对象。在添加到散列之前,所有键都会通过toString()转换为字符串。您可以使用一些测试代码确认:

<script>
  var array = [];
  array[0] = "zero";
  array[new Date().getTime()] = "now";
  array[3.14] = "pi";

  for (var i in array) {
      alert("array["+i+"] = " + array[i] + ", typeof("+i+") == " + typeof(i));
  }
</script>

显示器:

array[0] = zero, typeof(0) == string
array[1254503972355] = now, typeof(1254503972355) == string
array[3.14] = pi, typeof(3.14) == string

注意我是如何使用for...in语法的,它只给出了实际定义的索引。如果您使用更常见的for (var i = 0; i < array.length; ++i)迭代样式,那么您显然会遇到非标准数组索引的问题。

答案 1 :(得分:36)

实现JavaScript数组的精确程度因浏览器而异,但它们通常会回退到稀疏实现 - 很可能与常规对象的属性访问相同 - 如果使用实际数组会效率低下。

你必须要求对具体实现有更多了解的人来回答激烈触发从密集到稀疏的转变,但你的例子应该是非常安全的。如果你想获得一个密集的数组,你应该使用一个显式长度参数调用构造函数,并希望你实际上得到一个。

有关olliej的更详细说明,请参阅this answer

答案 2 :(得分:9)

您可以使用为此类设计设计的javascript语法来避免此问题。您可以将其视为字典,但“for ... in ...”语法将让您全部抓住它们。

var sparse = {}; // not []
sparse["whatever"] = "something";

答案 3 :(得分:7)

Javascript对象是稀疏的,并且数组只是具有自动维护长度属性的专用对象(实际上比最大索引大一个,已定义元素的数量)和一些其他方法。你是安全的;如果您需要额外的功能,请使用数组,否则使用对象。

答案 4 :(得分:2)

可以凭经验确定使用非标准process.memoryUsage()的NodeJS的稀疏性(或密度)。

有时节点足够聪明,可以使数组稀疏:

Welcome to Node.js v12.15.0.
Type ".help" for more information.
> console.log(`The script is using approximately ${Math.round(process.memoryUsage().heapUsed / 1024 / 1024 * 100) / 100} MB`)
The script is using approximately 3.07 MB
undefined
> array = []
[]
> array[2**24] = 2**24
16777216
> array
[ <16777216 empty items>, 16777216 ]
> console.log(`The script is using approximately ${Math.round(process.memoryUsage().heapUsed / 1024 / 1024 * 100) / 100} MB`)
The script is using approximately 2.8 MB
undefined

有时节点选择使其密集(将来可能会优化此行为):

> otherArray = Array(2**24)
[ <16777216 empty items> ]
> console.log(`The script is using approximately ${Math.round(process.memoryUsage().heapUsed / 1024 / 1024 * 100) / 100} MB`)
The script is using approximately 130.57 MB
undefined

然后再次稀疏:

> yetAnotherArray = Array(2**32-1)
[ <4294967295 empty items> ]
> console.log(`The script is using approximately ${Math.round(process.memoryUsage().heapUsed / 1024 / 1024 * 100) / 100} MB`)
The script is using approximately 130.68 MB
undefined

因此,也许可能需要使用range-alike来强制使用密集数组来了解原始的AIX内核错误:

> denseArray = [...Array(2**24).keys()]
[
   0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11,
  12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23,
  24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35,
  36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47,
  48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59,
  60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71,
  72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83,
  84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95,
  96, 97, 98, 99,
  ... 16777116 more items
]
> console.log(`The script is using approximately ${Math.round(process.memoryUsage().heapUsed / 1024 / 1024 * 100) / 100} MB`);
The script is using approximately 819.94 MB
undefined

因为为什么不让它跌倒?

> tooDenseArray = [...Array(2**32-1).keys()]

<--- Last few GCs --->

[60109:0x1028ca000]   171407 ms: Scavenge 1072.7 (1090.0) -> 1056.7 (1090.0) MB, 0.2 / 0.0 ms  (average mu = 0.968, current mu = 0.832) allocation failure 
[60109:0x1028ca000]   171420 ms: Scavenge 1072.7 (1090.0) -> 1056.7 (1090.0) MB, 0.2 / 0.0 ms  (average mu = 0.968, current mu = 0.832) allocation failure 
[60109:0x1028ca000]   171434 ms: Scavenge 1072.7 (1090.0) -> 1056.7 (1090.0) MB, 0.2 / 0.0 ms  (average mu = 0.968, current mu = 0.832) allocation failure 


<--- JS stacktrace --->

==== JS stack trace =========================================

    0: ExitFrame [pc: 0x100931399]
    1: StubFrame [pc: 0x1008ee227]
    2: StubFrame [pc: 0x100996051]
Security context: 0x1043830808a1 <JSObject>
    3: /* anonymous */ [0x1043830b6919] [repl:1] [bytecode=0x1043830b6841 offset=28](this=0x104306fc2261 <JSGlobal Object>)
    4: InternalFrame [pc: 0x1008aefdd]
    5: EntryFrame [pc: 0x1008aedb8]
    6: builtin exit frame: runInThisContext(this=0x104387b8cac1 <ContextifyScript map = 0x1043...

FATAL ERROR: invalid array length Allocation failed - JavaScript heap out of memory

Writing Node.js report to file: report.20200220.220620.60109.0.001.json
Node.js report completed
 1: 0x10007f4b9 node::Abort() [/Users/pzrq/.nvm/versions/node/v12.15.0/bin/node]
 2: 0x10007f63d node::OnFatalError(char const*, char const*) [/Users/pzrq/.nvm/versions/node/v12.15.0/bin/node]
 3: 0x100176a27 v8::Utils::ReportOOMFailure(v8::internal::Isolate*, char const*, bool) [/Users/pzrq/.nvm/versions/node/v12.15.0/bin/node]
 4: 0x1001769c3 v8::internal::V8::FatalProcessOutOfMemory(v8::internal::Isolate*, char const*, bool) [/Users/pzrq/.nvm/versions/node/v12.15.0/bin/node]
 5: 0x1002fab75 v8::internal::Heap::FatalProcessOutOfMemory(char const*) [/Users/pzrq/.nvm/versions/node/v12.15.0/bin/node]
 6: 0x1005f3e9b v8::internal::Runtime_FatalProcessOutOfMemoryInvalidArrayLength(int, unsigned long*, v8::internal::Isolate*) [/Users/pzrq/.nvm/versions/node/v12.15.0/bin/node]
 7: 0x100931399 Builtins_CEntry_Return1_DontSaveFPRegs_ArgvOnStack_NoBuiltinExit [/Users/pzrq/.nvm/versions/node/v12.15.0/bin/node]
 8: 0x1008ee227 Builtins_IterableToList [/Users/pzrq/.nvm/versions/node/v12.15.0/bin/node]
Abort trap: 6

答案 5 :(得分:1)

答案(通常在JavaScript中是这样)是“有点奇怪……”

未定义内存使用情况,并且任何实现都可以是愚蠢的。从理论上讲,const a = []; a[1000000]=0;const a = [];一样可以刻录兆字节的内存。实际上,即使Microsoft也避免了这些实现。

Justin Love指出,length属性是最高索引集。但是只有在索引为整数的情况下才更新。

因此,数组是稀疏的。但是,诸如reduce(),Math.max()和“ for ... of”之类的内置函数将遍历整个可能的整数索引范围,从0到长度,访问许多返回“未定义”的整数。但是“ for ... in”循环可能会按您期望的那样运行,只访问定义的键。

以下是使用Node.js的示例:

"use strict";
const print = console.log;

let a = [0, 10];
// a[2] and a[3] skipped
a[4] = 40;
a[5] = undefined;  // which counts towards setting the length
a[31.4] = 'ten pi';  // doesn't count towards setting the length
a['pi'] = 3.14;
print(`a.length= :${a.length}:, a = :${a}:`);
print(`Math.max(...a) = :${Math.max(a)}: because of 'undefined values'`);
for (let v of a) print(`v of a; v=:${v}:`);
for (let i in a) print(`i in a; i=:${i}: a[i]=${a[i]}`);

给予:

a.length= :6:, a = :0,10,,,40,:
Math.max(...a) = :NaN: because of 'undefined values'
v of a; v=:0:
v of a; v=:10:
v of a; v=:undefined:
v of a; v=:undefined:
v of a; v=:40:
v of a; v=:undefined:
i in a; i=:0: a[i]=0
i in a; i=:1: a[i]=10
i in a; i=:4: a[i]=40
i in a; i=:5: a[i]=undefined
i in a; i=:31.4: a[i]=ten pi
i in a; i=:pi: a[i]=3.14

但是。还有更多未提及数组的极端情况。

答案 6 :(得分:0)

可以,但不一定总是如此,当不是时,它们可以表现更好。

这里是有关如何在数组实例中测试索引稀疏性的讨论: https://benmccormick.org/2018/06/19/code-golf-sparse-arrays/

此代码高尔夫(最低字符)获胜者是:

let isSparse = a => !!a.reduce(x=>x-1,a.length)

基本遍历数组以获取索引条目,同时递减长度值并返回伪造/真实数值结果的强化!!布尔值(如果累加器一直递减为零,则索引将完全填充并不稀疏)。 Charles Merriam的上述注意事项也应予以考虑,并且此代码无法解决它们,但它们适用于哈希字符串条目,当使用arr[var]= (something)分配元素(其中var不是整数)时可能会发生这种情况。

关心索引稀疏性的原因是它对性能的影响,这在脚本引擎之间可能会有所不同,这里对数组创建/。初始化有很多讨论: What’s the difference between "Array()" and "[]" while declaring a JavaScript array?

该帖子的最新答案与深入探讨V8如何通过标记数组来优化数组以避免(重新)测试稀疏性https://v8.dev/blog/elements-kinds之类的特性有关。该博客文章来自17年9月,其内容可能会有所更改,但对于日常开发的影响细分是有用且清晰的。