所以现在我有了一个tensorflow模型,该模型接受具有固定宽度,高度,通道的可变长度框架的输入。例如,我可以采用shape(n,64,64,3)的张量。 n是否大于或等于10。现在,我想获取一个有重叠的滑动窗口,每隔100帧读取一次,放入tensorflow模型。 比如说第0-99帧,第90-189帧等等。
如何使其更快?
我能做的是使用cv2读取和提取100帧,对每个步骤都快退一点,然后读取接下来的100帧。将它们转换为张量并在会话中运行评估。但这会让我将会话输入放到一个循环中,这对我来说似乎是个坏主意。
另一种方法是,我可以在调整大小后将所有帧读取到列表中,并基于该列表构造张量。将它们添加到会话中,但这将迫使我使所有框架都适合内存,而不是很好的做法。
似乎tensorflow对阅读视频没有很好的支持。任何建议将不胜感激!