看看那里的OpenCL库,我试图全面掌握每一个。特别是一个图书馆是clBLAS。他们的网站声称它实施了BLAS 1,2级& 3种方法。这很好,但ViennaCL也有BLAS例程,线性代数求解器,支持OpenCL和CUDA后端,并且只是标题。在我看来,目前似乎没有理由使用clBLAS而不是ViennaCL,但我想知道是否有任何理由为什么人们会使用clBLAS而不是ViennaCL ?
虽然相似,但这是this previous question比较VexCL,Thrust和Boost.Compute的扩展。
答案 0 :(得分:3)
clBlas是由AMD实现的,所以人们可以希望它在AMD硬件上更快。这通常是供应商BLAS实施的唯一优势。不幸的是,这似乎并非如此。
在this talk维也纳集团的作者报告说,由于他们的自动调整框架,他们能够胜过clBLAS,或者表现出类似的表现。