我的任务是计算数组的总和。
我打算做的是使用OpenCL执行部分sun,以便内核返回一个与工作项数相对应的较小数组。 然后使用OpenMP来总结这个有点小的数组。
现在,我想知道我是否可以在OpenCL代码的主机部分使用OpenMP。如果是,我可以在OpenMP中使用OpenCL类型(比如cl_float4)。
我提前感谢你,
Éric.
答案 0 :(得分:1)
cl_float4
基本上代表4个float
值的数组,并为GPU提供适当的内存对齐。但是,它可以在主机代码中使用而没有任何问题。
答案 1 :(得分:0)
是的,您可以在主机代码中使用OpenMP,是的,您可以在OpenMP块中使用cl_float4。 OpenMP并不太关心你在并行部分内做了什么。