我正在使用 cupy,我想知道是否有任何方法可以加快以下计算速度
import cupy as cp
cp.sum([cp.dot(var, cp.matmul(M, var)).item() for var in x])
可以与 python 内置库并行,但我不知道这是否是最好(有效)的方法。我的需要源于上述总和在另一个循环中多次完成,移动 x
编辑:
这里x
是一个形状为(m, n)
的数组,所以每个var
都是一个长度为n
的一维数组,而M
是一个矩阵形状为 (n,n)
。