我已经编写了一个用于向量加法和向量乘法的cuda程序,但是我不知道如何测试程序的输出,无论答案/输出是否正确,是否有任何方法可以测试输出的正确性程序和aslo是否有任何在线数据集可用于cuda向量/矩阵加法/乘法?
答案 0 :(得分:-1)
通用方法是编写与内核完全相同的实现,并在CPU上生成结果[黄金标准],并将其与GPU内核的输出进行比较。这意味着将输出阵列复制到主机并在CPU上进行比较。对于向量加/乘,您可以生成一个随机数组,并在CPU和GPU(具有相同的输入数组)上生成输出,然后在CPU上进行比较。