如何修改ptx文件并将其链接到可执行文件?
BTW,我知道如何从.cu生成.ptx文件以及如何从.ptx生成.cubin。但我不知道如何获得最终的可执行文件。
更具体地说,我有一个sample.cu文件,它被编译为sample.ptx。然后我使用nvcc将sample.ptx编译为sample.cubin。但是,如果没有主机代码,则无法直接执行此.cubin文件。如何将.cubin文件链接到我原来的.cu文件以生成最终的可执行文件?
答案 0 :(得分:2)
您应该可以使用cuModuleLoadDataEx直接从cuda驱动程序api运行ptx代码。第5页有一个示例here
答案 1 :(得分:1)
从CUDA 4.0开始,您可以在CUDA内核中编写内联PTX。