tensorflow C ++:管理多个序列的LSTM模型

时间:2019-07-16 11:35:38

标签: c++ tensorflow machine-learning lstm

我正在使用LSTM模型构建C ++张量流应用程序,该应用程序将根据实时生成的许多不同序列预测事物。

LSTM保持内部状态,因此我不能(至少平凡)仅通过单个图形运行来自不同序列的数据,因为这会弄乱LSTM的内部状态。

我有两个解决这个问题的想法:

  1. 加载图形后,只需为每个序列完全复制图形即可。但 复制整个图似乎是一种过大的做法,浪费了内存。
  2. 对于每个序列,存储内部状态张量。而且,当使用session-> Run()在序列上运行推理时,以某种方式使其使用存储的当前序列的内部状态。

那么在许多不同的序列上管理LSTM模式有更好的主意吗? 如果不是,那么有关实现上述想法的参考文献有哪些?

0 个答案:

没有答案