标签: python numpy parallel-processing blas
我有一个(40000,40000)阵列A和矢量v,大小为40000.当我运行时
u = A.dot(b)
仅使用一个核心。是否有任何标准方法使其并行运行?
在RedHat上使用Anaconda发行版。 我看过很多关于BLAS / PBLAS / ATLAS / OpenBLAS的问题/答案,但我无法找到解决方法。