标签: computer-vision video-processing frames stride
我有一个约15秒的前视行人监控视频。该视频看起来有点像下面的图片。我想估计一个行人完成一步所需的帧数。
是否有任何论文可以描述可以执行此操作的技术? frontal view detected pedestrian