CUBLAS对每种类型的数据都有separate function,但我想从模板中调用CUBLAS,例如:
template <typename T> foo(...) {
...
cublas<S/D/C/Z>geam(..., const T* A, ...);
...
}
如何触发正确的函数调用?
答案 0 :(得分:2)
我为具有相同功能名称的不同类型编写了cublas包装函数。
inline cublasStatus_t cublasGgeam(cublasHandle_t handle,
cublasOperation_t transa, cublasOperation_t transb,
int m, int n,
const float *alpha,
const float *A, int lda,
const float *beta,
const float *B, int ldb,
float *C, int ldc)
{
return cublasSgeam(handle, transa, transb, m, n, alpha, A, lda, beta, B, ldb, C, ldc);
}
inline cublasStatus_t cublasGgeam(cublasHandle_t handle,
cublasOperation_t transa, cublasOperation_t transb,
int m, int n,
const double *alpha,
const double *A, int lda,
const double *beta,
const double *B, int ldb,
double *C, int ldc)
{
return cublasDgeam(handle, transa, transb, m, n, alpha, A, lda, beta, B, ldb, C, ldc);
}
之后,您可以为具有相同功能名称的任何类型调用geam()。 C ++编译器将根据参数的类型选择正确的函数。在你的情况下,它应该像
template <typename T> foo(...) {
...
cublasGgeam(..., A, ...);
...
}
这是一个完成时重载并且根本没有运行时成本,尽管您必须为包装函数编写一个长列表。