Darknet附带Cublas GEMM用于矩阵乘法,我想用CLblast GEMM Api替换Cublas GEMM。(https://github.com/CNugteren/CLBlast)
当我在库中添加clblast_cuda.h头文件时出现错误
/usr/local/include/clblast_cuda.h(104): error: identifier "CUdeviceptr" is undefined
/usr/local/include/clblast_cuda.h(262): error: identifier "CUcontext" is undefined
这指向头文件。
我已经用CLblast Cuda gemm成功编译并执行了一个独立的程序,我没有遇到任何问题。我使用nvcc -std=c++11 sgemm_cuda.cu -o sgemm -lcuda -lclblast
进行编译。
我确保在使用Darknet编译时使用类似的标志,但编译失败。
nvcc -gencode arch=compute_52,code=[sm_52,compute_52] -Iinclude/ -Isrc/ -DGPU -std=c++11 -I/usr/local/cuda/include/ -L/usr/local/cuda/lib64 -lcuda --compiler-options "-Wall -Wno-unknown-pragmas -Wfatal-errors -fPIC -Ofast -DGPU " -c ./src/sgemm.cu -o obj/sgemm.o
OS- Ubuntu 14 处理器 - Jetson Tx1 (ARM CPU内核) 有人可以帮我解决这个错误吗?