我在"计算能力列表"中放入了什么?配置Tensorflow时的字段?

时间:2016-12-29 22:45:43

标签: build configuration tensorflow

我从源代码构建Tensorflow,它要求我

Please specify a list of comma-separated Cuda compute capabilities you want to build with.
You can find the compute capability of your device at: https://developer.nvidia.com/cuda-gpus.
Please note that each additional compute capability significantly increases your build time and binary size.
[Default is: "3.5,5.2"]:

我发现它与我的卡计算能力(5.0,顺便说一句)有关,但显然不是它想要的,因为它是一个数字,而不是一个列表。我无法找到任何解释,也不熟悉从源代码中理解它。我该放什么?

2 个答案:

答案 0 :(得分:2)

总结评论作为答案:

你可以把5.0放在那里,这是你的卡支持的计算能力,应该是你的最佳选择。 3.5太低(不使用你的卡的全部功能)和5.2太高(你的卡不支持);在任何一种情况下,我相信二进制代码将在GPU上执行之前及时重新编译5.0。如果直接使用5.0,它将不会及时触发编译,并将使用更优化的离线编译。

如果您提供一个列表,例如3.5,5.0,5.2,它将为所有三个计算功能进行离线编译,并允许离线编译(更优化)代码在支持3.5或5.0或5.2的GPU卡上运行,不会触发较少优化的即时编译。在列表中添加更多计算功能的成本是增加了脱机编译时间和二进制大小。

答案 1 :(得分:0)

转到https://developer.nvidia.com/cuda-gpus

找出你的GPU。你会发现计算能力,就像我的6.1