大批量处理时,cublas批处理的gemm throw不支持的错误

时间:2018-07-24 13:42:40

标签: cuda precision cublas

我正在调用cublasGemmStridedBatchedEx()API。我的第一个矩阵以大步进行,第二个矩阵是固定的。该程序在少量输入的情况下运行良好,但是在大批量处理时会引发CUBLAS_STATUS_NOT_SUPPORTED错误。

根据cublas documentation,这表示不支持数据类型或算法。我看不到增加批处理大小如何更改数据类型。我使用默认的启发式GEMM算法。

我用CUDA9.2编译了代码,并在GTX 1050卡上运行了它。

代码:

RequestHeader unset X-My-Token "expr=! -R 'ip/mask'"

1 个答案:

答案 0 :(得分:1)

此问题应在刚刚发布的CUBLAS修补程序版本中得到纠正,并且可用here

寻找此补丁:

  

补丁1(于2018年8月6日发布)

这是一个修补程序,必须在正确的CUDA 9.2.148安装之上安装。

首先,您必须安装CUDA 9.2.148。然后安装补丁。