对于语义分割推论,我想提取视频的帧并通过网络运行它们,而无需使用OpenCV的VideoCapture之类的东西(在this question中回答):
vidcap = cv2.VideoCapture('testvideo.mp4')
原因是我不想安装该软件包,该软件包有点沉重,只能从视频中获取帧。
我目前要做的是使用ffmpeg
通过以下方式从视频中获取帧:
ffmpeg -i testvideo.mp4 frames/%05d.png
然后加载帧,执行推断并保存结果。我见过像ffmpeg-python这样的软件包,其中包含有关如何将视频加载到numpy数组中的示例,但我还没能正常工作。