我有两个不同的大numpy数组,几乎是(200k x 5k)和(5k x 150k)(它们在某些文件中不是预定义的数组,我必须根据某些算法来提取它们)。我需要计算他们的点积。在CPU上使用np.dot
计算点积确实很慢,而且我还有一个4GB的GPU,因此它们不适合GPU。
我想知道,Python中是否有任何简单的解决方案可以在GPU中计算点积批处理(块)?
我尝试了很多解决方案和主题。例如,与matmul
不同的numba
函数会产生错误的答案。
https://numba.pydata.org/numba-doc/dev/cuda/examples.html
http://jiajiamomomo.blogspot.com/2017/04/running-numba-example-of-matrix.html
我在Windows OS上使用numpy 1.16。根据{{1}}的结果,它具有np.show_config()
的支持。