python - 计算大矩阵特征值的最快方法

计算大矩阵特征值的最快方法

时间：2013-07-04 10:33:50

标签： python performance sparse-matrix eigenvalue adjacency-matrix

到目前为止，我使用numpy.linalg.eigvals来计算具有至少1000行/列的二次矩阵的特征值，并且在大多数情况下，其大约五分之一的条目非零（我不知道是否应该被认为是一个稀疏矩阵）。我找到了另一个topic，表明scipy可能会做得更好。

然而，由于我必须计算数十万个大小不断增大的大型矩阵的特征值（可能高达20000行/列，是的，我需要所有的特征值），这将总是花费很长时间。如果我能加快速度，即使只是最微小的一点，也很可能值得努力。

所以我的问题是：当不限制自己使用python时，是否有更快的方法来计算特征值？

2 个答案:

答案 0 :(得分：4)

@HighPerformanceMark在评论中是正确的，因为numpy（LAPACK等）背后的算法是最好的，但也许不是最先进的，用于对齐整个矩阵的数值算法。但是，如果您有以下情况，基本可以加快速度：

稀疏矩阵

如果您的矩阵是稀疏的，即填充条目的数量是k，那么k<<N**2就是{{1}}，那么您应该看scipy.sparse。

带状矩阵

有许多算法可以处理特定banded structure的矩阵。查看scipy.linalg.solve.banded中的解算器。

最大特征值

大多数情况下，您并非真正需要所有特征值。事实上，大多数物理信息来自最大的特征值，其余的只是高频振荡，只是瞬态的。在这种情况下，您应该研究快速收敛到那些最大特征值/向量的特征值解，例如Lanczos algorithm。

答案 1 :(得分：1)

在没有代码更改的情况下（特别是在多核机器上）获得体面加速的简单方法是将numpy链接到更快的线性代数库，如MKL，ACML或OpenBLAS。如果您与学术机构有联系，优秀的Anaconda python发行版将让您轻松链接到MKL免费;否则，您可以支付30美元（在这种情况下，您应该首先尝试优化的30天试用版）或do it yourself（这是一个有点烦人的过程，但绝对可行）。

我绝对会尝试使用稀疏特征值求解器。