用于训练CNN的FLOPS

时间:2020-05-25 12:58:44

标签: tensorflow deep-learning gpu benchmarking cnn

我想在进行深度学习时找到我GPU的实际TFLOP。

有什么方法可以找到训练像ResNet50这样的模型所必需的浮点运算吗?

我找到了一些在线确定推论失败的方法(一张图片),但我不确定如何进行训练。

我认为这将是模型*图像数量*历时的触发器,但是这种方式我没有考虑反向传播。

我发现一些基准输出每秒处理的图像数,这会有所帮助吗?

0 个答案:

没有答案