GPU并行化使用numpy函数的代码

时间:2018-10-04 17:25:46

标签: python numpy parallel-processing gpu numba

我正在尝试并行化我编写的Python函数,以同时在多个GPU内核上运行,但是似乎这样做的当前方法(例如,从numba进行vectorize和guvectorize)不允许任何比简单的复杂的事情函数(https://github.com/numba/numba/issues/2736)中的算术运算。

我的问题是,除了numba之外,是否有其他软件包或技术能够处理调用numpy函数的函数,例如numpy.where或numpy.intersect1d?

这里是GPU编程的全新功能,不确定是否具有最先进的功能,如果这个问题看起来很愚蠢,请您谅解。

非常感谢!

0 个答案:

没有答案