我使用的还原代码基本上与文档中的示例完全相同。下面的代码应返回2^3 + 2^3 = 16
,但它会返回9.我做错了什么?
import numpy
import pycuda.reduction as reduct
import pycuda.gpuarray as gpuarray
import pycuda.autoinit
from pycuda.compiler import SourceModule as module
newzeros = [{1,2,3},{4,5,6}]
gpuSum = reduct.ReductionKernel(numpy.uint64, neutral="0", reduce_expr="a+b", map_expr="1 << x[i]", arguments="int* x")
mylengths = pycuda.gpuarray.to_gpu(numpy.array(map(len,newzeros),dtype = "uint64",))
sumfalse = gpuSum(mylengths).get()
print sumfalse
答案 0 :(得分:1)
我只是想通了。定义内核时使用的参数列表应为unsigned long *x
,而不是int *x
。我在其他地方使用64位整数,它搞砸了。