应用错误收集

使用GPU的TF的bidirectional_dynamic_rnn效率低

时间：2017-05-10 08:06:48

标签： tensorflow gpu

我正在使用NVIDIA Tesla P40来训练分类模型。我使用tensorflow的bidirectional_dynamic_rnn来构建bi-lstm网络，并且训练效率很差，只使用了大约30％的计算资源，速度甚至没有比使用具有45个逻辑核心的CPU更快。可以帮助完全使用GPU计算资源提供一些建议，或解释原因?????

1 个答案:

答案 0 :(得分：0)

第一个提示：尝试增加batch_size。它将增加并行使用的数据量，从而减少I / O时间。

请注意，它需要更多GPU内存，因此您必须对其进行调整以避免内存不足错误。

Trie，C代码。效率低？
测量GPU程序的效率
使用低GPU优先级进行背景渲染
Spark的奴隶效率低
我内核的FLOP效率非常低
CUDA翘曲执行效率
数据存储效率，低级API
使用GPU的TF的bidirectional_dynamic_rnn效率低
bidirectional_dynamic_rnn的输出？
CUDA程序/设备的效率

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？