Question

我对标题中提到的所有内容都比较新，所以请耐心等待。

目前我一直坚持使用python和C之间的转换。由于CUDA内核是用C语言编写的，所以我不能只用python的方式来看它。

由于文档相当有限，而且初学者过于复杂，我想问一下pyCuda如何实际转换python（或numpy）数组以供在C中使用。

例如，字符串“stuff”是C中的字符数组，但在python中它是一个不可变的字符串。但是我可以做到以下几点：

stuff = "stuff"
d_stuff = cuda.mem_alloc(len(stuff))
cuda.memcpy_htod(d_stuff, stuff)

在CUDA内核中，现在我可以将它用作char * d_stuff。

但是我无法以同样的方式恢复它，因为python字符串是不可变的。因此，执行以下操作显然会引发错误：

newstuff = ""
cuda.memcpy_dtoh(newstuff, d_stuff)

我知道这些可以写成

d_stuff = gpuarray.to_gpu(numpy.array(stuff)) # I need numpy, as the to_gpu expects an array
newstuff = d_stuff.get()

但是我不知道它是如何工作的，以及它在幕后的作用，所以我真的很感激，如果有人能够解释转换是如何工作的话。（例如，第二个例子是怎样的给回一个字符串）

此外，我对使用numpy创建的数组有疑问。我已经看到它们被广泛用于GPU，但我不知道它们是如何工作的。

给numpy一个字符串是否会根据C代码创建一个字符数组，如果是的话，字符串数组会变成char还是其他什么？（当然，当转换为C时）< / p>

仅使用C编写CUDA代码可能会更好，但我想探索python的功能，而我正在为学习目的而做这一切。

Answer 1

我想问一下PyCUDA如何实际转换python（或numpy）数组以供在C中使用。

没有。 PyCUDA只需要任何支持Python buffer protocol的对象（通常是一个numpy数组），并直接访问其主机内存缓冲区，以便与GPU之间传输数据。永远执行类型转换或数据操作。类型是从CTypes interface直接推断出来的（通常是通过numpy dtype，因为numpy数组是常用的数据源。）

给numpy一个字符串是否会根据C代码创建一个字符数组，如果是的话，字符串数组会变成char还是其他什么？

这取决于。例如，这样做：

ttt = np.asarray([ "stuff" + str(i)  for i in range(0,20) ])

print( ttt.dtype, type(ttt[0]) ) 
|S7 <type 'numpy.string_'>

这里numpy使用一个特殊的固定长度字符串数据类型，其长度是根据输入数据计算的。这对于char[7]的C有序数组是有效的。查看更多here。由于缓冲协议和底层直接映射到本机C类型，PyCUDA自动理解如何处理这个问题。

但是你也可以这样做：

ttt = np.asarray([ "stuff" + str(i)  for i in range(0,20) ], dtype=object)

print( ttt.dtype, type(ttt[0]) )
object <type 'str'>

这里，创建的numpy数组包含Python对象（在本例中为字符串）。这不是可以在PyCUDA中使用的东西，因为Python对象在C中没有直接表示。

PyCUDA + numpy，一般使用字符串

1 个答案: