我正在对具有两个类别的数据集执行视频分类(例如,板球活动和广告之间的分类)。我在训练数据集上有〜1000个视频,在测试数据集中有〜300个视频。
我正在参考以下链接:
Five video classification methods implemented in Keras and TensorFlow
Continuous online video classification with TensorFlow, Inception and a Raspberry Pi
我的数据集包含同一视频中的两个活动(打板球和打广告)。
由于时间特征在视频分类中很重要,因此我计划应用CNN + LSTM / 3D CNN / opticalFlow模型。但是,我怀疑上述链接中的给定方法在这种情况下是否行得通,因为它希望根据标签将火车数据集视频分开。
另一个问题是,在对包含多个标签的视频进行分类时,时间特征是否有助于提高分类准确性并减少闪烁?