我正在努力实现一种比特式排序,作为cuda中最接近的一对d& c算法的一部分,我遇到了Thrust库。我注意到它实现了基数排序,从我读过的,它是整数最快但是这对于浮点数是一样的吗?为浮子或仅使用推力版本实施bitonic排序会更好吗? 提前谢谢。
答案 0 :(得分:2)
如果您对速度感兴趣,则不应编写自己的排序算法。排序是一项受到相当多关注的操作,无论您使用的是int
还是float
,您都不可能像已经编写的那样快速提出某些内容。
您应该考虑使用thrust,back40computing,moderngpu或CUB中的算法在GPU上进行排序。