在我的代码中,我通常使用numpy数组来连接方法和类。优化我的程序的核心部分我使用cython与那些numpy数组的c指针。不幸的是,我目前正在声明阵列的方式很长。
例如,假设我有一个方法应该返回一个numpy数组someArrayNumpy,但是在函数指针内部* someArrayPointers应该用于速度。这就是我通常声明的方式:
cdef:
numpy.ndarray someArrayNumpy = numpy.zeros(someArraySize)
numpy.ndarray[numpy.double_t, ndim=1] someArrayBuff = someArrayNumpy
double *someArrayPointers = <double *> someArrayBuff.data
[... some Code ...]
return someArrayNumpy
正如您所看到的,基本上一个数组需要3行代码,而且我必须声明更多这些数组。
有更紧凑/聪明的方法吗?我想我错过了什么。
修改
因为J. Martinot-Lagarde问我,我指的是C指针和“numpy指针”。代码基本上是
for ii in range(someArraySize):
someArrayPointers[ii] += 1
和
for ii in range(someArraySize):
someArrayBuff[ii] += 1
使用上面的定义,但我添加“ndim = 1,mode ='c'”只是为了确保。结果是someArraySize = 1e8(以毫秒为单位):
testMartinot("cPointers")
531.276941299
testMartinot("numpyPointers")
498.730182648
这是我从之前/不同的基准测试中粗略记住的。
答案 0 :(得分:6)
你实际上在这里声明了两个numpy数组,第一个是通用的,第二个是特定的dtype。你可以跳过第一行,someArrayBuff是一个ndarray。
这给出了:
numpy.ndarray[numpy.double_t] someArrayNumpy = numpy.zeros(someArraySize)
double *someArrayPointers = <double *> someArrayNumpy.data
你需要至少两行,因为你正在使用someArrayPointers并返回someArrayNumpy,所以你必须声明它们。
作为旁注,如果你声明数组的类型和数量,你确定指针比ndarrays更快吗?
numpy.ndarray[numpy.double_t, ndim=2] someArrayNumpy = numpy.zeros(someArraySize)