如何在没有优化的情况下编译cuda内核?

时间:2012-10-14 14:57:12

标签: cuda gpgpu

如果我编译这个

__global__ void dummy_kernel(float *a, int N, float* b, int N2){
    unsigned int i = blockIdx.y*blockDim.y + threadIdx.y;
    unsigned int j = blockIdx.x*blockDim.x + threadIdx.x; 
}

我得到这个空的ptx代码

.entry _Z9dummy_kernelPfiS_i(
.param .u64 _Z9dummy_kernelPfiS_i_param_0,
.param .u32 _Z9dummy_kernelPfiS_i_param_1,
.param .u64 _Z9dummy_kernelPfiS_i_param_2,
.param .u32 _Z9dummy_kernelPfiS_i_param_3
)
{

ret; 
}

有没有办法强制编译器生成ptx而不进行优化?

1 个答案:

答案 0 :(得分:4)

尝试-g -G切换 看看它发布了什么 我不确定这将涵盖所有可能的优化