CUBLAS库:查找实际值的最大值而不是绝对值

时间:2013-03-13 09:56:21

标签: cuda cublas

NVIDIA CUDA的CUBLAS库允许查找具有最大绝对值的元素/索引(cublasIsamax)。是否可以使用CUBLAS简化函数以某种方式找到具有最大实际值的元素/索引?

[我正在使用CUBLAS 3.2版。]

修改  
约束:我无法以任何方式改变生产服务器的状态。这意味着我不能使用推力/ cudpp,并且我坚持使用旧版本的CUBLAS。

1 个答案:

答案 0 :(得分:3)

我不确定你指的是“减少功能”。

CUBLAS基本上只是用于CUDA设备的BLAS的“同类似”实现。它仅提供标准的1级,2级和3级BLAS功能,以及正好三个扩展 - geam(缩放矩阵加法/换位),dgmm(对角化矩阵 - 矩阵点积)和getrfBatched(许多小矩阵的批量LU分解)。这些函数都不会找到所提供的矢量或矩阵的有符号最大值。

NVIDIA发货cudppthrust,其中任何一种都可能更适合此排序操作。此外,CUBLAS 3.2还有两年半的历史。

作为最终评论,我强烈建议使用CUBLAS 4.x或CUBLAS 5.x版本。代码的API和性能已大大提高,特别是对于较新的硬件。