Question

关于JVM基于char []实现字符串创建的方式的问题，我已经提到当char []被复制到新字符串的内部时不会发生迭代，因为System.arraycopy得到了最终调用，它使用诸如memcpy之类的函数在原生的，依赖于实现的级别（the original question）复制所需的内存。

我想亲自检查一下，所以我下载了Openjdk 7源代码并开始浏览它。我在openjdx/hotspot/src/share/vm/oops/objArrayKlass.cpp中的OpenJDK C ++源代码中找到了System.arraycopy的实现：

if (stype == bound || Klass::cast(stype)->is_subtype_of(bound)) {
  // elements are guaranteed to be subtypes, so no check necessary
  bs->write_ref_array_pre(dst, length);
  Copy::conjoint_oops_atomic(src, dst, length);
} else {
  // slow case: need individual subtype checks

如果元素不需要类型检查（例如原始数据类型数组的情况），则调用Copy :: conjoin_oops_atomic。

Copy::conjoint_oops_atomic函数位于'copy.hpp'中：

// overloaded for UseCompressedOops
static void conjoint_oops_atomic(narrowOop* from, narrowOop* to, size_t count) {
  assert(sizeof(narrowOop) == sizeof(jint), "this cast is wrong");
  assert_params_ok(from, to, LogBytesPerInt);
  pd_conjoint_jints_atomic((jint*)from, (jint*)to, count);
}

现在我们依赖于平台，因为复制操作具有基于OS /体系结构的不同实现。我将以Windows为例。 openjdk\hotspot\src\os_cpu\windows_x86\vm\copy_windows_x86.inline.hpp：

static void pd_conjoint_oops_atomic(oop* from, oop* to, size_t count) {
// Do better than this: inline memmove body  NEEDS CLEANUP
if (from > to) {
  while (count-- > 0) {
    // Copy forwards
    *to++ = *from++;
  }
} else {
  from += count - 1;
  to   += count - 1;
  while (count-- > 0) {
    // Copy backwards
    *to-- = *from--;
  }
 }
}

而且......令我惊讶的是，它遍历元素（oop值），逐个复制它们（看似）。有人可以通过迭代数组中的元素来解释复制的原因，即使是在本机级别吗？

Answer 1

因为jint最接近地映射到int，它最接近地映射到旧硬件架构WORD，其大小基本上与数据总线的宽度相同。

今天的存储器架构和CPU处理被设计为即使在高速缓存未命中的情况下也尝试处理，并且存储器位置倾向于预取块。您正在考虑的代码并不像您想象的那样“糟糕”。硬件更智能，如果你实际上没有配置文件，你的“智能”提取程序实际上可能什么都不添加（甚至减慢处理速度）。

当介绍硬件架构时，必须介绍简单的架构。现代的做得更多，所以你不能认为看起来低效的代码实际上是低效的。例如，当完成内存查找以评估if语句的条件时，通常在查找发生时执行if语句的两个分支，并且在数据可用于评估之后丢弃处理的“假”分支。条件。如果您想提高效率，则必须对配置文件进行分析，然后对其进行操作。

查看JVM操作码部分的分支。您将看到（或者可能只是）ifdef宏奇怪支持（一次）跳转到处理操作码的代码的三种不同方式。这是因为三种不同的方式实际上在不同的Windows，Linux和Solaris架构上产生了有意义的性能差异。

也许他们可能已经包含了MMX例程，但是他们没有告诉我，SUN认为现代硬件的性能提升不足以担心它。

OpenJDK实现System.arraycopy

1 个答案: