Question

我一直在用现有的Java代码开发一个C ++项目。我有以下C ++代码和Java代码从同一个测试文件中读取，该文件由数百万个整数组成。

C ++：

    int * arr = new int[len]; //len is larger than the largest int from the data
    fill_n(arr, len, -1);  //fill with -1
    long loadFromIndex = 0;
    struct stat sizeResults;
    long size;
    if (stat(fileSrc, &sizeResults) == 0) {
        size = sizeResults.st_size; //here size would be ~551950000 for 552M test file
    }
    mmapFile = (char *)mmap(NULL, size, PROT_READ, MAP_SHARED, fd, pageNum*pageSize);
    long offset = loadFromIndex % pageSize;
    while (offset < size) {
        int i = htonl(*((int *)(mmapFile + offset)));
        offset += sizeof(int);
        int j = htonl(*((int *)(mmapFile + offset)));
        offset += sizeof(int);
        swapElem(i, j, arr);
    }
    return arr;

爪哇：

    IntBuffer bb = srcFile.getChannel()
                    .map(MapMode.READ_ONLY, loadFromIndex, size)
                    .asIntBuffer().asReadOnlyBuffer();
    while (bb.hasRemaining()) {
        int i = bb.get();
        int j = bb.get();
        swapElem(i, j, arr); //arr is an int[] of the same size as the arr in C++ version, filled with -1
    }
    return arr;

C ++和Java中的

void swapElem(arr)是完全相同的。它比较和修改数组中的值，但原始代码有点长，可以在这里发布。出于测试目的，我用以下函数替换它，因此循环不会是死代码：

void swapElem(int i, int j, int * arr){   // int[] in Java
    arr[i] = j;
}

我认为C ++版本应该优于java版本，但测试结果相反 - Java代码几乎是C ++代码的两倍。有没有办法改进C ++代码？

我觉得C ++中的mmapFile+offset可能重复了太多次，因此它增加了O（n）和offset+=sizeof(int)的O（n）加法，其中n是要读取的整数数。对于Java的IntBuffer.get()，它只是直接从缓冲区的索引中读取，因此除了缓冲区索引的O（n）增量外，不需要添加操作。因此，包括缓冲区索引的增量，C ++需要O（2n） Java添加O（n）时添加的内容。当谈到数百万个数据时，可能会导致显着的性能差异。

遵循这个想法，我修改了C ++代码如下：

    mmapBin = (char *)mmap(NULL, size, PROT_READ, MAP_SHARED, fd, pageNum*pageSize);
    int len = size - loadFromIndex % pageSize;
    char * offset = loadFromIndex % pageSize + mmapBin;
    int index = 0;
    while (index < len) {
        int i = htonl(*((int *)(offset)));
        offset += sizeof(int);
        int j = htonl(*((int *)(offset)));
        offset += sizeof(int);
        index+=2*sizeof(int);
    }

我认为会有轻微的性能提升，但没有。

有谁可以解释为什么C ++代码比Java代码工作得慢？感谢。

更新

我不得不道歉，当我说-O2不起作用时，我的问题就出现了问题。我弄乱了Makefile，所以C ++代码没有使用-O2重新编译。我已经更新了性能，使用-O2的C ++版本优于Java版本。这可以解决问题，但如果有人想分享如何改进C ++代码，我会遵循。通常我希望它比Java代码快2倍，但目前它不是。谢谢大家的意见。

编译器：g ++

标志：-Wall -c -O2

Java版本：1.8.0_05

文件大小：552MB，全部4字节整数

处理器：2.53 GHz Intel Core 2 Duo

内存4GB 1067 MHz DDR3

更新了基准：

版本时间（毫秒）

C ++：~1100

Java：~1400

C ++（没有while循环）：〜35

Java（没有while循环）：〜40

我在这些代码之前有一些东西导致~35ms的性能（主要是用-1填充数组），但这在这里并不重要。

Answer 1

我怀疑基准测试方法是否正确。两个代码都是“死”代码。你实际上并没有在任何地方使用i和j，所以gcc编译器或Java JIT可能决定实际删除循环，看它对未来的代码流没有影响。

无论如何，我会将C ++代码更改为：

mmapFile = (char *)mmap(NULL, size, PROT_READ, MAP_SHARED, fd, pageNum*pageSize);
long offset = loadFromIndex % pageSize;
int i, j;
int szInc = 2 * sizeof(int);
while (offset < size) {
    scanf(mmapFile, "%d", &i);
    scanf(mmapFile, "%d", &j);
    offset += szInc; // offset += 8;
}

这相当于Java代码。另外我会继续使用-O2作为编译标志。请记住，htonl是Java代码似乎没有做到的额外转换。

mmap（）vs Java MappedByteBuffer的性能？

更新

更新了基准：

1 个答案: