Question

我正在调用cublasGemmStridedBatchedEx（）API。我的第一个矩阵以大步进行，第二个矩阵是固定的。该程序在少量输入的情况下运行良好，但是在大批量处理时会引发CUBLAS_STATUS_NOT_SUPPORTED错误。

根据cublas documentation，这表示不支持数据类型或算法。我看不到增加批处理大小如何更改数据类型。我使用默认的启发式GEMM算法。

我用CUDA9.2编译了代码，并在GTX 1050卡上运行了它。

代码：

RequestHeader unset X-My-Token "expr=! -R 'ip/mask'"

Answer 1

此问题应在刚刚发布的CUBLAS修补程序版本中得到纠正，并且可用here

寻找此补丁：

补丁1（于2018年8月6日发布）

这是一个修补程序，必须在正确的CUDA 9.2.148安装之上安装。

首先，您必须安装CUDA 9.2.148。然后安装补丁。