我在应用程序中使用了Eigen,通过分析,我发现了代码 与以下类似成为瓶颈。问题是记忆 在数据传递到用法之前进行复制(请参见下文)。
在代码中可见,用于matmat函数的“数据”可以具有 两个起源之一,一个起源私有存储在SMM类中,而另一个起源 是动态动态生成的。这种分裂对我来说是必要的 应用程序,但这使其难以优化。只是来源 从数据的内部向量看来,const Eigen :: Refs会 是一个简单的解决方案。也许是由于我的代码编写方式引起的,但是 复制省略似乎并没有我希望做的那么多。一世 考虑使用shared_ptr来防止在周围复制矩阵( 可能会很大),但我不确定这是否是正确的方向。
应注意,matmat的结果永远不需要存储,它是 仅在本征表达式中用作临时变量
在这种情况下,如何有效地传递矩阵?
以下代码是我正在使用的设置的简化。
#include <Eigen/Dense>
#include <Eigen/StdVector>
#include <iostream>
using namespace Eigen;
typedef MatrixXd MMatrix;
enum class Storage {Normal, On_The_Fly };
MMatrix matrixGen(int additional_data) {
return additional_data * MMatrix::Random(5, 5);
}
class SMM {
private:
std::vector<MMatrix, Eigen::aligned_allocator<MMatrix> > data_;
//Provides controlled access to the data
MMatrix get_data(int i, Storage mem, int additional_data = 0) {
if (mem != Storage::On_The_Fly) {
return data_[i];
}
else {
return matrixGen(additional_data);
}
}
public:
// Only a placeholder constructor, in my actual program the building
// is significantly more complex, and doesn't build the data immediately
SMM(Storage mem) {
if (mem == Storage::Normal) {
for (int i = 0; i < 5; i++) {
data_.emplace_back(matrixGen(5));
}
}
}
//Similar to a matrix * matrix product
MMatrix matmat(const MMatrix& A, int index, Storage mem, int additional_data = 0) {
if (mem == Storage::On_The_Fly) {
return this->get_data(index, mem, additional_data) * A;
}
else {
return this->get_data(index, mem) * A;
}
}
};
int main() {
Storage mem1 = Storage::Normal;
Storage mem2 = Storage::On_The_Fly;
SMM smm1 = SMM(mem1);
SMM smm2 = SMM(mem2);
MMatrix A = MMatrix::Random(5, 5);
MMatrix B = MMatrix::Random(5, 5);
MMatrix C = MMatrix::Random(5, 5);
B += smm1.matmat(A, 2, mem1);
C += smm2.matmat(A, 2, mem2, 5);
std::cout << B << std::endl << std::endl;
std::cout << C << std::endl;
}
答案 0 :(得分:1)
一个简单的解决方案是使用缓存成员变量:
class SMM {
...
MMatrix cache_;
const MMatrix& get_data(int i, Storage mem, int additional_data = 0) {
if (mem != Storage::On_The_Fly) { return data_[i]; }
else {
matrixGenInPlace(additional_data,cache_);
return cache_;
}
}
...
};