应用错误收集

JVM收集时间是否随着JVM RAM大小呈指数级增长？

时间：2018-02-14 04:49:09

标签： performance garbage-collection jvm

我听到一位同事说：

JVM垃圾收集时间随着JVM大小呈指数级增长。这是因为引用树是要分配的对象数量的函数 - 随着对象数量的增加，遍历树的指数级变得越来越难。

听起来不错。

我听到另一位同事说：

同一台机器上的JVM垃圾收集是线性的。鉴于同一台计算机上的两个4G JVM中的8GB JVM拆分（通过微服务）将具有相同的垃圾收集持续时间，因为相同的操作系统会降低相同数量的对象的速度。

这看起来并不正确 - 因为两个较小的JVM上的对象树应该更浅，更容易遍历。

我的问题是： JVM收集时间是否随JVM RAM大小呈指数级增长？

假设：使用Oracle JVM。

2 个答案:

答案 0 :(得分：2)

虽然霍尔格斯的解释是正确的，但我想对它略微不同。 GC采用的时间与实时集中的活动对象数成正比。这很容易证明。假设我们有两个具有相同大小的堆的应用程序。在第一个堆中，我们分配10个对象，每个对象100 MB，每个对应1000个100字节。在下一个gc中，每个应用程序中的一半对象都无法访问（死机）并且可以收集。

不言而喻，用最多的物体追踪图表需要更长的时间。

（顺便说一句，我记得读过“浅而宽”和“深而窄”的测量结果，并且没有明显的区别，但我无法记住在哪里。 @Holger：如果你有一个来源，我很乐意阅读它。）
请注意，遵循已建立的Java编码实践实际上将确保实时集很小。 JVM希望你能够以这种方式进行编码，并且非常努力地帮助保持实时设置很小，escape analysis只是Hot Spots套管中的一个技巧。

简而言之：否

答案 1 :(得分：1)

没有这种简单的依赖。

首先，将“垃圾收集”视为对象引用上的函数显然只是指标记阶段，忽略了分配，解除分配或复制/移动对象的成本。标记成本取决于必须遍历的 live 引用的数量，死对象或未使用的内存都不会对其产生任何影响。因此，仅向同一应用程序提供更多RAM并不一定会改变垃圾收集性能。

有一种趋势是使用你为JVM提供的任何数量的RAM，因此提供更多RAM可能会使垃圾收集周期减少，但可能需要更多时间来标记所有活动对象。但由于垃圾收集之间有更多的时间会增加对象被闲置的可能性，因此标记成本通常不会与收集之间的时间相同。

很容易证明它实际上是另一种方式。只需使用一个任意Java应用程序，将可用内存减少到几乎没有遇到OutOfMemoryError的情况。您将看到提供更少RAM的速度如何使速度变得更慢，越接近这一点就越慢。另一方面，实际上没有必要证明给应用程序提供如此多的RAM以至于它在其生命周期中从不需要垃圾收集具有最小的成本。

当我们仅考虑标记阶段时，不考虑它发生的频率，只考虑它如何与实时参考的数量一起扩展，仍然没有理由说它应该是指数的。对象引用可以形成很少是树的任意图形。此外，垃圾收集器不需要遍历每个对象引用。它只需要遍历对之前没有遇到的对象的引用（猜测为什么它被称为“标记”），这意味着需要遍历的引用数量与活动对象的数量相同。可能需要花费一些成本才能找到不需要遍历的引用，但这仍然是线性开销。

像HotSpot这样的JVM（它不再是Sun的属性）使用分代垃圾收集和卡片标记，只遍历新对象和内存部分（卡片）已更改的旧对象的引用，而不是所有活动对象。由于更改旧对象和创建新对象都需要CPU时间，因此不会直接使用可用RAM进行扩展。