Question

我正在尝试在Kera中使用1D卷积实现视频预测的时间序列。我已经从预训练的CNN模型中提取了特征向量。每个功能向量的大小为2048。因此，如果视频包含100帧，则输入大小将为（100，2048）。但是问题是每个视频的帧数都不相同，我无法适应Keras中输入数据的可变大小。我的代码如下：

#video 1 has 100 frames (100,2048)
#video 2 has 52 frames (52,2048)
#video 3 has 81 frames (81,2048)

frame = ? #I am confused how to use it for different size of data or how to change it
model_m = Sequential()
model_m.add(Conv1D(100, 10, activation='relu', input_shape=(frames, 2048)))
model_m.add(Conv1D(100, 10, activation='relu'))
model_m.add(MaxPooling1D(3))
model_m.add(Conv1D(160, 10, activation='relu'))
model_m.add(Conv1D(160, 10, activation='relu'))
model_m.add(GlobalAveragePooling1D())
model_m.add(Dropout(0.5))
model_m.add(Dense(num_classes, activation='softmax'))
print(model_m.summary())

请帮助我，我将非常感激。

使用一维转换的时间序列预测

0 个答案: