我们都知道,用Java分配的每个对象都增加了以后的垃圾回收周期的权重,Optional<T>
对象也不例外。我们经常使用这些对象来包装可为空的对象,这将导致代码更安全,但是要付出什么代价呢?
是否有人知道可选对象添加了什么样的附加GC压力,而不是简单返回空值,以及这对高通量系统的性能有何影响?
答案 0 :(得分:5)
我们都知道,用Java分配的每个对象都会在未来的垃圾回收周期中增加权重,……
这听起来像是一条没有人可以否认的声明,但是让我们看一下垃圾收集器的实际工作,考虑现代JVM的常见实现以及分配的对象对其的影响,尤其是像Optional
实例这样的对象,通常是暂时性的。
垃圾收集器的首要任务是识别仍然存在的对象。 “垃圾收集器”这个名称着重于识别垃圾,但是垃圾被定义为不可访问的对象,而找出哪些对象不可访问的唯一方法是通过消除过程。因此,第一个任务是通过遍历和标记所有可到达的对象来解决。因此,此过程的成本不取决于分配的对象的总数,而仅取决于仍可以实现的对象。
第二个任务是使垃圾内存可用于新分配。所有现代垃圾收集器都通过撤离完整区域,将带有该内存的所有活动对象转移到新位置并调整引用来工作,而不是困扰仍然可以访问的对象之间的内存缺口。在此过程之后,整个块可将内存用于新分配。因此,这又是一个过程,其成本不取决于分配的对象的总数,而仅取决于仍然存在的对象的(一部分)。
因此,如果一个临时Optional
之类的对象在两个垃圾回收周期之间分配和放弃,则可能不会对实际垃圾回收过程造成任何代价。
当然有一个收获。每次分配都会减少可用于后续分配的内存,直到没有剩余空间并且必须进行垃圾收集为止。因此,可以说,每次分配都会减少两次垃圾回收运行之间的时间,方法是分配空间的大小除以对象大小。这不仅是很小的一部分,而且还仅适用于单线程方案。
在像Hotspot JVM这样的实现中,每个线程都将线程本地分配缓冲区(TLAB)用于新对象。一旦TLAB装满,它将从分配空间(又名Eden空间)中获取一个新的。如果没有可用的,将触发垃圾回收。现在,不太可能所有线程都同时到达其TLAB的末端。因此,对于此时在其TLAB中仍剩余空间的其他线程,如果它们分配了更多仍适合该剩余空间的对象,则不会有任何区别。
也许令人惊讶的结论是,不是每个分配的对象都会对垃圾回收产生影响,即由线程分配的不触发下一个gc的纯本地对象可能是完全免费的。
当然,这不适用于分配大量对象。分配很多它们会导致线程分配更多的TLAB,并最终比没有的情况更早触发垃圾回收。这就是为什么我们有像IntStream
这样的类,可以像Stream<Integer>
那样处理大量元素而无需分配对象,而将结果作为单个{{1} }实例。众所周知,单个临时对象对gc的影响很小(如果有的话)。
这甚至都没有触及JVM的优化器,如果Escape Analysis已证明该对象纯粹是本地的,则它可以消除热点中的对象分配。