我是一名Cython初学者,我只是尝试玩一个玩具示例来获得cython并行循环功能prange
的体验。以下是我的示例代码cy_sum_parallel.pyx
,它尝试使用prange
简单地对二维数组求和。
# distutils: extra_compile_args = -fopenmp
# distutils: extra_link_args = -fopenmp
cimport cython
from cython.parallel cimport prange
@cython.boundscheck(False)
@cython.wraparound(False)
cdef double sum_with_parallel(double[:,::1] arr_2d):
cdef:
unsigned int i, j, M, N
double partial_sum = 0.0
M = arr_2d.shape[0]
N = arr_2d.shape[1]
for i in prange(M, nogil=True):
for j in range(N):
partial_sum += arr_2d[i, j]
return partial_sum
import numpy as np
arr = np.ones(shape=(10000,10000), dtype=np.double, order='C')
def main():
return sum_with_parallel(arr)
使用最少setup.py
个脚本
from distutils.core import setup, Extension
from Cython.Build import cythonize
ext = Extension(name='cy_sum_parallel',
sources=['cy_sum_parallel.pyx'])
setup(ext_modules=cythonize(ext))
当我运行setup.py
脚本时,它会抛出以下编译器警告:
gcc -pthread -DNDEBUG -g -fwrapv -O3 -Wall -Wstrict-prototypes -fPIC -I/home/Jian/anaconda3/include/python3.4m -c cy_sum_parallel.c -o build/temp.linux-x86_64-3.4/cy_sum_parallel.o -fopenmp
cy_sum_parallel.c: In function ‘__pyx_f_15cy_sum_parallel_sum_with_parallel._omp_fn.0’:
cy_sum_parallel.c:1388:29: warning: ‘__pyx_v_j’ may be used uninitialized in this function [-Wmaybe-uninitialized]
#pragma omp for lastprivate(__pyx_v_j) firstprivate(__pyx_v_i) lastprivate(__pyx_v_i)
^
cy_sum_parallel.c:1316:7: note: ‘__pyx_v_j’ was declared here
int __pyx_v_j;
^
我认为此警告告诉我j
已声明但未初始化。所以我的问题是我应该对此警告信息做些什么吗?以及如何?
编译好的代码似乎运行正常
import sys
sys.path.append('/home/Jian/Dropbox/Coding/Python/Cython/ex_parallel')
import cy_sum_parallel
%prun -s tottime -l 5 cy_sum_parallel.main()
与非并行版本相比,性能提升了3倍,这是8核机器的预期结果。
非常感谢任何帮助。
答案 0 :(得分:1)
您始终可以查看生成的C代码以检查上下文。如果要生成代码,请使用cython -a <filename.pyx>
创建可浏览的html文件,或仅使用cython <filename.pyx>
生成C文件。
代码有点复杂,并且使用了很多临时变量(指定为__pyx_t_*
),但看起来像这样
/* code snippet starts in an already quite nested set of for-loops */
#ifdef _OPENMP
#pragma omp for lastprivate(__pyx_v_j) firstprivate(__pyx_v_i) lastprivate(__pyx_v_i)
#endif /* _OPENMP */
for (__pyx_t_2 = 0; __pyx_t_2 < __pyx_t_3; __pyx_t_2++){
{
__pyx_v_i = 0 + 1 * __pyx_t_2;
/* Initialize private variables to invalid values */
__pyx_v_j = ((unsigned int)0xbad0bad0);
__pyx_t_4 = __pyx_v_N;
for (__pyx_t_5 = 0; __pyx_t_5 < __pyx_t_4; __pyx_t_5+=1) {
__pyx_v_j = __pyx_t_5;
/* etc */
我认为在这种情况下,如果循环的大小为0(产生消息的原因),变量__pyx_v_j
将不会被初始化,但它不会在循环外使用所以这并不重要。 (我在循环之后省略了代码,以免占用太多空间,但你可以自己检查一下!)
因此忽略警告 - 这是一种错误的诊断。