我有巨大的矩阵,我希望矩阵的输出与输入矩阵的大小相同,只需每个单元格得到相邻单元格的数字总和。
您能指导我如何使用CUDA在GPGPU平台上进行处理吗?
答案 0 :(得分:1)
您必须将所有相邻单元格的值传递给内核(作为参数),这样您才能完成总和。 参数列表中的类似内容和后面的代码: (int actualCellvalue,int adj1,int adj2,int adj3 ...)
{ actualCellvalue = actualCellvalue + adj1 + adj2 + adj3 ....; }
这可能是错的,但这就是我从你的真正的简短说明中得到的结果。
此致 彼得