标签: cuda gpu
在cuda中有std :: memcmp的替代方法吗? 我想在矩阵上比较整个行,在cpu上,只需调用std :: memcmp就可以了,在gpu上有高效的方法吗?
操作如下: Sorting arrays in NumPy by column
答案 0 :(得分:0)
虽然功能上与std::memcmp不同,但推力模板库包含比较归约运算thrust::equal,当两个迭代器范围的元素相同比较时,它将返回true或false。
std::memcmp
thrust::equal
如果您确实需要比较符号,则需要编写自己的实现。