我正在尝试并行化我编写的Python函数,以同时在多个GPU内核上运行,但是似乎这样做的当前方法(例如,从numba进行vectorize和guvectorize)不允许任何比简单的复杂的事情函数(https://github.com/numba/numba/issues/2736)中的算术运算。
我的问题是,除了numba之外,是否有其他软件包或技术能够处理调用numpy函数的函数,例如numpy.where或numpy.intersect1d?
这里是GPU编程的全新功能,不确定是否具有最先进的功能,如果这个问题看起来很愚蠢,请您谅解。
非常感谢!