c++ - CUDA设备端代码

CUDA是C ++系列中的一种编程语言。因此，CUDA文档通常不会复制标准C ++文档，它只是指出差异和扩展。如果您无法在CUDA文档中找到使用inline说明符和函数的说明，那么这表明它是以标准C ++方式处理的。

在问题的各个部分之间进行插值，似乎您最关心的是inline的使用如何影响生成代码中函数的实际内联。

ISO C ++ 11标准将inline指定为7.1.2节中的函数属性。除了关于链接和重复定义的规定之外，它还说明了使用inline说明符实际内联函数的内容：

内联说明符指示实现内联在呼叫点替换功能体是优于通常的函数调用机制。一个实现是不需要在通话点执行此内联替换;

所以inline只是编译器的建议，它可以自由忽略。由于CUDA编译器默认在设备代码中积极地内联函数（出于性能原因），inline的使用对于设备代码来说似乎是多余的，但程序员可以自由地使用它。

CUDA编译器使用的内联启发式可能会阻止程序员想要在所有情况下内联的特定函数的内联。为此，CUDA提供了非标准__forceinline__函数属性。此说明符会影响设备代码和主机代码，因为nvcc会将其转换为主机代码的等效主机编译器特定属性，例如MSVC的__forceinline。这可以通过转储和检查nvcc发送给主机编译器的中间C ++文件来验证。

CUDA设备端代码

1 个答案: