我正在尝试将500-1000 numpy矩阵相乘,并重复1000次左右。我已经成功地并行化了重复部分,并获得了2倍的速度提升(对于我正在使用的参数)。有什么方法可以并行化矩阵乘法吗?
因为矩阵乘法不是可交换的,所以我不认为我可以像重复步骤那样使用Pool.map()来简单地做到这一点。我能想到的与此并行的唯一方法是将1000个矩阵划分为2个相邻矩阵的集合,并将每个矩阵分别相乘得到500个矩阵,然后重复该步骤。但是我不知道是否有任何为此目的编写的算法或执行此操作的任何简单方法。
例如-
请向我建议一种方法,甚至可以参考一下。