标签: conv-neural-network feature-extraction unsupervised-learning dimension-reduction
我需要找到视频的特征表示。为了这个目的, 我为每个视频都有视频帧,我想为每个帧利用基于CNN的特征描述符。但是,当我为每个帧具有特征时,我就会失去每个帧之间的时间关系。找到每个框架的特征后,可以使用什么框架来添加顺序框架之间的关系?最后,我需要每个视频都有特征表示吗?