矢量push_back非常慢

时间:2015-01-08 03:36:35

标签: c++ performance vector

因此,我出于性能原因将我编写的Java代码转换为C ++代码的过程以及使用CUDA并行处理某些内容的意图。但是,我想做的第一件事就是直接转换,只需使用与java相同的代码在C ++中运行。

我遇到的问题是,下面的循环实际上需要花费几分钟才能完成C ++,而在Java中几乎没有任何时间。唯一的区别是我在C ++中使用向量而在Java中使用ArrayList

当我最初创建单元格向量时,我也为邻居向量保留了适当的大小。此代码的目的是在3d立方体中创建一个统一的单元格网格,并在以后方便地将每个单元格的邻居存储在单元格内部。

我正在使用Visual Studio 2013,以防万一(对于C ++)和Eclipse对于java。

我觉得我肯定错过了一些简单的东西,因为这样的减速似乎很疯狂,但当我注释掉push_back时,代码基本上立即执行。

whd都是20cellsCell结构的向量(见下文)。

for (int i = 0; i < w; i++) {
    for (int j = 0; j < h; j++) {
        for (int k = 0; k < d; k++) {
            for (int x = -1; x < 2; x++) {
                for (int y = -1; y < 2; y++) {
                    for (int z = -1; z < 2; z++) {
                        if (i + x >= 0 && i + x < w && j + y >= 0 && j + y < h && k + z >= 0 && k + z < d) {
                            cells[i][j][k].addNeighbor(cells[i + x][j + y][k + z]);
                        }
                    }
                }
            }
        }
    }
}

在另一个文件中定义:

struct Cell {
    std::vector<Particle> particles;
    std::vector<Cell> neighbors;
    int b = 0;

    void addParticle(Particle &p) {
        particles.push_back(p);
    }

    void addNeighbor(Cell &c) {
        neighbors.push_back(c);
    }
};

2 个答案:

答案 0 :(得分:7)

在C ++中,标准容器(如vector)按值存储元素,而不是通过引用(如Java中那样)。这意味着你的循环正在创建的单元格不仅引用到其他单元格,而且包含它们。你最终会创建一个包含矢量的矢量嵌套的巨大森林,它们本身也包含矢量,等等(深度最多约20个级别!)。

您可能想要做的是存储指向相邻单元格的指针:

struct Cell {
    ...

    std::vector<Cell*> neighbors;

    ...

    void addNeighbor(Cell &c) {
        neighbors.push_back(&c);
    }
};

这允许单元格相互存储弱引用。

请记住,C ++没有垃圾收集器,也没有进行太多安全检查,所以完全有责任确保在不再需要单元格时释放单元格,并且在指定时不指向指针细胞消失了。

答案 1 :(得分:0)

对于细胞,上述答案就足够了。但对于粒子,会提出以下模型:

void addParticle(Particle &p) {
        particles.push_back(p);
    }

上面的代码在内存中创建了大量的Particle对象并进行了大量的数据复制。以下模型将节省内存分配和复制:

struct Cell {
    std::vector<Particle> particles;
    Particle& getNextParticleRefForUpdate()
    {
        particles.push_back(Particle());
        return particles.at(particles.size() - 1);
    }
    ...
 };

粒子类会暴露set函数:

struct Particle
{
    int a;
    int b;

    void set(int& aval, int& bval)
    {
        a = aval;
        b = bval;
    }
    ...
};

在设置Cell对象的粒子对象时,该函数将执行以下操作:

Cell cell_val;
int aval = 5
int bval = 10;
Particle& par_val = cell_val.getNextParticleRefForUpdate();
par_val.set(aval, bval);