任何矩阵库顺序中立吗?

时间:2016-11-05 11:37:47

标签: c++ excel eigen cilk-plus

很抱歉,如果这太长了,但我觉得这个问题需要澄清:

我正在使用Excel的xll库,即包含可以直接从单元格注册和调用的函数的C库。理想情况下,这些函数也应该从VBA调用(或适用于调用), 为了更复杂的计算(根查找,颂歌,优化)提供解释环境,这些计算不适合Excel工作表。需要说明的是:有一种方法可以从vba(函数Application.Run)调用工作表函数,但它为所有参数和返回值支付了从/到变体类型的不可接受的转换价格。现在有趣的情况是,在同一个Excel环境中,二维矩阵以不同的方式传递:

  • 对于表函数,本机Excel-C接口以行主顺序传递给C矩阵(FP12的类型) Excel SDK);

  • 对于vba,矩阵是LPSAFEARRAY,其数据按列主要顺序组织。

对于一维数据(向量),有一个可以追溯到BLAS(30年前)的解决方案,可以转换为 C具有类似

的结构
struct VECTOR { 
    int n;
    int stride;
    double * data;
    double & operator [] (int i) { return data[(i - 1)*stride]; }   
}   

换句话说,我们使用计算中间结构,它不拥有数据,但可以映射两个连续的 数据或数据以恒定间隙(步幅)线性间隔开。结构的数据可以按顺序处理,但它们可以 也转换为数组部分(如果使用cilk):

data [ 0 : n : stride ]

当我们从向量移动到矩阵时,我已经读过可以使用矩阵顺序从矩阵中抽象出来 行步幅和列步幅。我的天真尝试可能是:

struct MATRIX {
    int rows;
    int cols;
    int rowstride;
    int colstride;
    double * data;
    inline double & operator () (int i, int j)  { return data[(i - 1)*rowstride + (j - 1)*colstride]; }
    MATRIX(int nrows, int ncols, int incrw, int inccl, double* dt) {rows = nrows; cols = ncols, rowstride = incrw; colstride = inccl; data = dt; }
    MATRIX(FP12 & A)        { rows = A.rows;  cols = A.cols;  data = A.array; rowstride = cols; colstride = 1;  }
    MATRIX(LPSAFEARRAY & x) { rows = ROWS(x); cols = COLS(x); data = DATA(x); rowstride = 1;    colstride = rows; }
    int els() { return rows * cols; }
    bool isRowMajor() { return rowstride > 1; }
    bool isScalar()   { return (rows == 1) & (cols == 1); }
    bool isRow()      { return (rows == 1); }
    bool isCol()      { return (cols == 1); }
    VECTOR col(int i) { return {rows, rowstride, &data[(i - 1)*colstride] }; }      // Col(1..)
    VECTOR row(int i) { return {cols, colstride, &data[(i - 1)*rowstride] }; }      // Row(1..)
    VECTOR all()      { return {els(), 1, data}; }  
    void copyFrom   (MATRIX & B) { for (int i = 1; i <= rows; i++) ROW(*this, i) = ROW(B, i); }
    MATRIX & Transp (MATRIX & B) { for (int i = 1; i <= rows; i++) ROW(*this, i) = COL(B, i); return *this; }
    void BinaryOp   (BinaryFcn f, MATRIX & B);
    MATRIX TranspInPlace() { return MATRIX(cols, rows, colstride, rowstride, data); }
    MATRIX SubMatrix(int irow, int icol, int nrows, int ncols) { return MATRIX(nrows, ncols, rowstride, colstride, &(*this)(irow, icol)); }
};  

来自FP12或LPSAFEARRAY的两个构造函数初始化指向数据的结构,该数据是行主要或列主要组织的。这是订单中立的吗?在我看来是的:数据访问(索引)和行/列选择都是独立于订单的正确。给定两次乘法,索引速度较慢,但​​可以非常快速地映射行和列:矩阵库的所有目的之后是最小化单个数据访问。而且,它是 非常容易编写返回行或列的数组部分的宏,以及整个矩阵:

#define COL(A,i) (A).data[(i-1)*(A).colstride : (A).rows : (A).rowstride]           // COL(A,1)
#define ROW(A,i) (A).data[(i-1)*(A).rowstride : (A).cols : (A).colstride]           // ROW(A,1)
#define FULL(A)  (A).data[0 : (A).rows * (A).cols]                                  // FULL MATRIX

在上面的代码索引从1开始,但即使这可以使用(可修改的)0-1参数抽象 硬编码的位置1. all()函数/ FULL()宏仅对整个连续矩阵是正确的,而不是 一个子矩阵。但也可以调整,在这种情况下切换到行上的循环。或多或少像上面的copyFrom方法(),它可以在行主要表示和列主要表示之间转换(复制)矩阵。

还要注意TranspInPlace方法:通过交换行/列和rowstride / colstride,我们可以对相同的未触摸数据进行逻辑转置,这意味着不再需要将逻辑交换机传递给通用例程(例如,GEMM)对于 矩阵乘法,即使(公平地说)这不包括共轭转置的情况。)

鉴于上述情况,我正在寻找一个实现这种方法的库,以便我可以使用(挂钩)它,但我的搜索到现在并不令人满意:

GSL Gsl使用行主顺序。停止。

LAPACK 本机代码是列专业。 C接口提供了处理行主数据的可能性,但只提供量身定制的数据 代码或(在某些例程中)在对矩阵进行操作之前对其进行物理转置。

EIGEN 作为一个模板化的图书馆,它可以对待两者。不幸的是,矩阵顺序是模板的参数 意味着每个矩阵方法都将被复制。它有效,但并不理想。

请让我知道图书馆是否更接近我所追求的目标。 THX。

1 个答案:

答案 0 :(得分:1)

在Eigen中,您可以使用具有运行时内部和外部步幅的Map来模仿它。例如,如果你坚持使用ColumnMajor,那么内部步幅对应于行间距,而外部步幅对应于列步幅:

Map<MatrixXd,0,Stride<> > mat(ptr, rows, cols, Stride<>(colStride,rowStride));

然后,您可以对mat执行任何操作,例如访问行mat.row(i),列mat.col(j),执行产品,解决线性系统等。

这种方法的主要缺点是你松开了SIMD矢量化。