标签: tensorflow tensorflow-gpu tensorflow-xla
NV V100 / P100是否有最佳fp16性能可用的无缝方式? 例如。我在fp32中训练了一个模型和实现。该应用程序完美。现在,我想探索fp16的体验。有没有简单的方法来启用它。
答案 0 :(得分:0)
尝试这个method,我发现在Pascal架构GPU上对fp16的推断更快,有人可以解释一下吗?