Question

我已经问了类似的东西，但这次我会更具体。

我需要在for循环内执行通常大的正定对称矩阵（约1000x1000）的Cholesky分解。现在，要做到这一点，我一直试着：

1）Apache Math库

2）并列Colt库

3）JLapack库

在上述三种情况中，如果与MATLAB相比，时间消耗非常长。

因此我想知道在Java中是否存在用于Cholesky分解的高度优化的外部工具：例如，我一直在考虑CHOLMOD算法，它实际上是在MATLAB内部调用的和其他工具。

我真的很感激能够就这件事得到彻底的反馈。

Answer 1

以下是Java的一些BLAS库的一个很好的总结：performance-of-java-matrix-math-libraries。您还可以在Java-Matrix-Benchmark看到许多这些库中的许多库的基准。

然而，根据我的经验，大多数这些库似乎没有针对解决大型稀疏矩阵进行调整。就我而言，我所做的是使用Eigen通过JNI实现解决。

Eigen has a good discussion on its linear solvers包括CHOLMOD上的一个。

对于我使用Eigen的求解器通过JNI的8860x8860稀疏矩阵的情况比平行小马快20倍，比我自己的密集求解器快10倍。更重要的是，它似乎缩放为n^2而不是n^3，并且它使用的内存比我的密集解算器少得多（我的内存扩展速度不足）。

实际上有一个名为JEigen的Eigen包装器使用JNI。但是，它没有实现稀疏矩阵求解，因此它不会包装所有内容。

我最初使用JNA但对开销不满意。维基百科有a good example on how to use JNI。编写函数声明并使用javac编译它们之后，使用javah为C ++创建头文件。

例如

//Cholesky.java
package cfd.optimisation;
//ri, ci, v : matrix row indices, column indices, and values
//y = Ax where A is a nxn matrix with nnz non-zero values
public class Cholesky {
    private static native void solve_eigenLDLTx(int[] ri, int[] ci, double[] v, double[] x, double[] y, int n, int nnz);
}

使用javah生成带有声明的头文件 cfd_optimization_Cholesky.h

JNIEXPORT void JNICALL Java_cfd_optimisation_Cholesky_solve_1eigenLDLTx
        (JNIEnv *, jclass, jintArray, jintArray, jdoubleArray, jdoubleArray, jdoubleArray, jint, jint);

以下是我实现解算器的方法

JNIEXPORT void JNICALL Java_cfd_optimisation_Cholesky_solve_1eigenLDLTx(JNIEnv *env, jclass obj, jintArray arrri, jintArray arrci, jdoubleArray arrv, jdoubleArray arrx, jdoubleArray arry, jint jn, jint jnnz) {
    int n = jn;
    int *ri = (int*)env->GetPrimitiveArrayCritical(arrri, 0);
    int *ci = (int*)env->GetPrimitiveArrayCritical(arrci, 0);
    double *v = (double*)env->GetPrimitiveArrayCritical(arrv, 0);
    int nnz = jnnz;

    double *x = (double*)env->GetPrimitiveArrayCritical(arrx, 0);
    double *y = (double*)env->GetPrimitiveArrayCritical(arry, 0);

    Eigen::SparseMatrix<double> A = colt2eigen(ri, ci, v, nnz, n);
    //Eigen::MappedSparseMatrix<double> A(n, n, nnz, ri, ci, v);

    Eigen::VectorXd a(n), b(n);
    for (int i = 0; i < n; i++) a(i) = x[i];
    //a = Eigen::Map<Eigen::VectorXd>(x, n).cast<double>(); 
    Eigen::SimplicialCholesky<Eigen::SparseMatrix<double> > solver;
    solver.setMode(Eigen::SimplicialCholeskyLDLT);
    b = solver.compute(A).solve(a);
    for (int i = 0; i < n; i++) y[i] = b(i);
    env->ReleasePrimitiveArrayCritical(arrri, ri, 0);
    env->ReleasePrimitiveArrayCritical(arrci, ci, 0);
    env->ReleasePrimitiveArrayCritical(arrv, v, 0);
    env->ReleasePrimitiveArrayCritical(arrx, x, 0);
    env->ReleasePrimitiveArrayCritical(arry, y, 0);
}

函数colt2eigen从两个整数数组创建一个稀疏矩阵，其中包含行索引和列索引以及值的双数组。

Eigen::SparseMatrix<double> colt2eigen(int *ri, int *ci, double* v, int nnz, int n) {
    std::vector<Eigen::Triplet<double>> tripletList;
    for (int i = 0; i < nnz; i++) { 
        tripletList.push_back(Eigen::Triplet<double>(ri[i], ci[i], v[i]));  
    }
    Eigen::SparseMatrix<double> m(n, n);
    m.setFromTriplets(tripletList.begin(), tripletList.end());
    return m;
}

其中一个棘手的部分是从Java和Colt获取这些数组。去做这个我这样做了

//y = A x: x and y are double[] arrays and A is DoubleMatrix2D
int nnz = A.cardinality();
DoubleArrayList v = new DoubleArrayList(nnz);
IntArrayList ci = new IntArrayList(nnz);
IntArrayList ri = new IntArrayList(nnz);

A.forEachNonZero((row, column, value) -> {
    v.add(value); ci.add(column); ri.add(row); return value;}
);

Cholesky.solve_eigenLDLTx(ri.elements(), ci.elements(), v.elements(), x, y, n, nnz);

Answer 2

我没有使用任何这些工具，但我怀疑你是因为Java在某些版本/某些平台上没有使用本机处理器浮点平方根指令这一事实。 / p>

请参阅：Where can I find the source code for Java's Square Root function?

如果绝对准确性不是必需的，您可以尝试切换上述实现之一以使用平方根的近似值（请参阅Fast sqrt in Java at the expense of accuracy获取建议），这应该更快一些。

Java中的CHOLMOD

2 个答案: