我编写了一个CUDA应用程序,其中包含一些硬编码参数(通过#define
s)。一切似乎都正常,所以我尝试了其他一些参数。现在,该程序不再正常工作。
所以,我想调试它。我使用-deviceemu -g -O0
选项编译应用程序,因为我读到我可以使用gdb来调试它。在gdb中,我使用break kernelstart
在内核启动时设置断点。
但是,gdb会在我的CUDA内核开始时跳转,但是我不能单步执行它,因为它不允许我检查内核中的内容。我认为最好是给出gdb的输出:
Breakpoint 1, kernelstart (__cuda_0=0x100000, __cuda_1=0x101000, __cuda_2=0x102000, __cuda_3=0x102100) at cudatest.cu:287
(gdb) s
__device_stub__Z12kernelstartPjS_S_S_ (__par0=0x100000, __par1=0x101000, __par2=0x102000, __par3=0x102100) at /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c:7
7 /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c: No such file or directory.
in /tmp/tmpxft_000003c4_00000000-1_cudatest.cudafe1.stub.c
(gdb) s
cudaLaunch<char> (entry=0x804a98d "U\211\345\203\354\030\213E\024\211D$\f\213E\020\211D$\b\213E\f\211D$\004\213E\b\211\004$\350\r\377\377\377\311\303U\211\345\203\354\070\307\004$\340 \005\b\350\345\341\377\377\243P!\005\b\307\004$x\234\004\b\350\b\001") at /usr/local/cuda/bin/../include/cuda_runtime.h:773
(gdb) s
(gdb) s
cudatest (__cuda_0=0x100000, __cuda_1=0x101000, __cuda_2=0x102000, __cuda_3=0x102100) at cudatest.cu:354
(gdb) s
之后,它会跳回我的main
程序。
我知道我的规格不仅仅是含糊不清,但任何人都可以猜出问题出在哪里?是否可以使用gdb检查内核?
答案 0 :(得分:7)
nvcc -g -G filename.cu
等命令获取当前正在执行的线程的详细信息。存在其他命令,如cuda thread
。cuda block
有关更多详细信息,请参阅最新版本的cuda-gdb文档。如果您使用的是最新版本的cuda工具包(即截至今天的3.2),请确保您正在查看最新版本的文档(因为选项已经发生了很大变化)。
还要确保从控制台(X11外部)运行cuda-gdb,因为您要停止GPU进行调试。
希望这有帮助。
答案 1 :(得分:1)
编译:
nvcc -g -G --keep
为我解决了这个问题。这样可以确保编译期间生成的所有中间文件都不会被删除,以便调试器可以找到它们。