我正在调用cublasGemmStridedBatchedEx()API。我的第一个矩阵以大步进行,第二个矩阵是固定的。该程序在少量输入的情况下运行良好,但是在大批量处理时会引发CUBLAS_STATUS_NOT_SUPPORTED错误。
根据cublas documentation,这表示不支持数据类型或算法。我看不到增加批处理大小如何更改数据类型。我使用默认的启发式GEMM算法。
我用CUDA9.2编译了代码,并在GTX 1050卡上运行了它。
代码:
RequestHeader unset X-My-Token "expr=! -R 'ip/mask'"
答案 0 :(得分:1)
此问题应在刚刚发布的CUBLAS修补程序版本中得到纠正,并且可用here
寻找此补丁:
补丁1(于2018年8月6日发布)
这是一个修补程序,必须在正确的CUDA 9.2.148安装之上安装。
首先,您必须安装CUDA 9.2.148。然后安装补丁。