我有一个使用cuda启用的功能和gcc编译的二进制文件。我想知道二进制文件中包含哪些cuda架构?
我的意思是sm和计算兼容性编号为-gencode arch=compute_XX,code=sm_XX
。
答案 0 :(得分:1)
NVIDIA提供了二进制实用程序,可以显示标头并反汇编目标文件,库和可执行文件中的二进制有效负载。 cudaobjdump
可以如下使用:
>>> from tqdm import tqdm
>>> for i in tqdm(range(10000000), total=10000000):
... pass
...
100%|██████████████████████████| 10000000/10000000 [00:03<00:00, 2665344.22it/s]
其中显示了可执行文件中包含的二进制和PTX有效负载。