我正在编写一个实现Keras中的'Squential'的类,该类返回一批图像。本质上,困难在于 getitem (),该函数以固定形状返回一批图像,如下所示。棘手的是指向它:
[batch_size, frames, height, width, channels]
问题是如何堆叠这些单独的图像读取,以确保在整形后说每一批都具有例如5帧,这5帧将以正确的顺序属于它们最初制作的同一视频,即-imread()
。
我很难决定如何构建该张量,因为它是5维,在这种5维中,我必须确保在数组转换后不影响视频的顺序。
这些张量必须输入到神经网络中,因此张量顺序错误-在错误的事情上浪费了很多时间。