标签: c++ cuda runtime runtime-compilation
我正在开发一个C ++程序,它使用nvrtc在运行时生成并编译CUDA代码。我想要生成的CUDA代码取决于C ++中函数的一些参数。每次修改参数时,编译都需要很长时间,通常超过1小时。但是当我修改参数时,它会在几秒钟内编译。有谁知道是否存在某种"缓存"用于CUDA运行时编译?如果是这样,我可以在哪里找到它们,是否可以将它们存储在某处,这样如果代码之前已经编译过,就不需要从头开始编译代码?
nvrtc
谢谢!