基于python GPU的批处理点产品

时间:2019-04-26 17:14:08

标签: python performance numpy numba dot-product

我有两个不同的大numpy数组,几乎是(200k x 5k)和(5k x 150k)(它们在某些文件中不是预定义的数组,我必须根据某些算法来提取它们)。我需要计算他们的点积。在CPU上使用np.dot计算点积确实很慢,而且我还有一个4GB的GPU,因此它们不适合GPU。 我想知道,Python中是否有任何简单的解决方案可以在GPU中计算点积批处理(块)?

我尝试了很多解决方案和主题。例如,与matmul不同的numba函数会产生错误的答案。 https://numba.pydata.org/numba-doc/dev/cuda/examples.html http://jiajiamomomo.blogspot.com/2017/04/running-numba-example-of-matrix.html

我在Windows OS上使用numpy 1.16。根据{{​​1}}的结果,它具有np.show_config()的支持。

0 个答案:

没有答案