根据3D顺序数据生成5D张量

时间:2019-01-08 19:28:08

标签: python tensorflow matrix keras transformation

我正在编写一个实现Keras中的'Squential'的类,该类返回一批图像。本质上,困难在于 getitem (),该函数以固定形状返回一批图像,如下所示。棘手的是指向它:

  1. 输出张量的格式必须为[batch_size, frames, height, width, channels]
  2. 我目前只有一张表格,该表格向下列出了固定大小的不同视频的不同帧的路径。例如,我将从每个视频中提取5帧,该表从索引1开始从第一个视频开始,依次逐帧加载所有5帧,直到第4帧为止。在第5帧到第9帧开始正在加载第二个视频10-14-第三个...
  3. 我们目前能做的是批量读取该表,其中每个帧都由scikit.io.imread()读取,并以3-D numpy数组形式返回。

问题是如何堆叠这些单独的图像读取,以确保在整形后说每一批都具有例如5帧,这5帧将以正确的顺序属于它们最初制作的同一视频,即-imread()

我很难决定如何构建该张量,因为它是5维,在这种5维中,我必须确保在数组转换后不影响视频的顺序。

这些张量必须输入到神经网络中,因此张量顺序错误-在错误的事情上浪费了很多时间。

0 个答案:

没有答案