为什么Keras LSTM在jetson gpu上的推理要比jetson cpu慢?

时间:2018-08-22 08:39:04

标签: python tensorflow keras lstm nvidia-jetson

我检查了Jetson的推理性能。

我使用了以下代码。

https://github.com/keras-team/keras/blob/master/examples/lstm_text_generation.py

关于推理速度的结果

  • GPU

    • LSTM:推断:0.08-0.17s
    • CuDNNLSTM:推断:0.006-0.01s
  • CPU

    • LSTM:推断:0.006-0.013s

下面是推理速度检查代码。

```

@contextmanager
def timer(title):
    t0 = time.time()
    yield
    print("{} - done in {:.10f}s".format(title, time.time() - t0))

我不明白为什么对gpu的LSTM推理要慢于cpu。

有人可以帮我为什么LSTM对gpu的推理要慢于cpu吗?

环境信息

  • python版本:3.5.2
  • tensorflow版本:1.9.0rc0
  • keras版本:2.2.2
  • cuda版本:9.0
  • Jetson:TX2

0 个答案:

没有答案