多维张量作为张量流中rnn的输入(tf.contrib.rnn.RNNCell)

时间:2018-09-05 08:25:10

标签: python tensorflow deep-learning computer-vision rnn

来自有关tf.contrib.rnn.RNNCell的Tensorflow文档:“单元格的定义不同于文献中使用的定义。在文献中,'单元格'是指具有单个标量输出的对象。该定义涉及这种单位的水平阵列。”

似乎rnn单元只接受向量作为输入。但是,我想将图片/视频提供给rnn(例如[批量大小,步长,高度,宽度,通道])。有没有办法使用rnn单元格和动态rnn来做到这一点,还是我必须手动构造rnn?

1 个答案:

答案 0 :(得分:0)

正如您所说的,RNN仅接受诸如[batch_size,sequence_lentgh,features]之类的张量作为输入。

为了从tensorflow中使用RNN,您将必须为每帧提取带有CNN的特征,并将CNN输出数据转换为遵循[batch_size,sequence_lentgh,features]形状的张量,以将其馈送到RNN