我正在尝试在步态识别上实现深度学习算法。但是在将数据馈送到网络之前,我在重塑过程中遇到了一些问题。
我正在使用CasiaB数据集,该数据集包含124个具有10种不同携带条件的受试者(7个用于训练)和从11个不同角度拍摄的图像。在每个角度中,有50帧(对丢失的帧进行了填充),图像尺寸为64x64。我试图实现CNN-LSTM模型,该模型具有ConvLSTM2D层但没有运气。
我找到了类似的作品,但这是一个多对多的问题,而我的问题却是一个多对一的问题。
当将数据形状馈送到CNN或从CNN馈送到LSTM层时,该如何处理数据形状?与目标形状(y_train)有什么区别,例如上面5维的文章,但我需要3维的目标,因为它存在多对一的问题?