我正在尝试在Kera中使用1D卷积实现视频预测的时间序列。我已经从预训练的CNN模型中提取了特征向量。每个功能向量的大小为2048。因此,如果视频包含100帧,则输入大小将为(100,2048)。但是问题是每个视频的帧数都不相同,我无法适应Keras中输入数据的可变大小。我的代码如下:
#video 1 has 100 frames (100,2048)
#video 2 has 52 frames (52,2048)
#video 3 has 81 frames (81,2048)
frame = ? #I am confused how to use it for different size of data or how to change it
model_m = Sequential()
model_m.add(Conv1D(100, 10, activation='relu', input_shape=(frames, 2048)))
model_m.add(Conv1D(100, 10, activation='relu'))
model_m.add(MaxPooling1D(3))
model_m.add(Conv1D(160, 10, activation='relu'))
model_m.add(Conv1D(160, 10, activation='relu'))
model_m.add(GlobalAveragePooling1D())
model_m.add(Dropout(0.5))
model_m.add(Dense(num_classes, activation='softmax'))
print(model_m.summary())
请帮助我,我将非常感激。