标签: video neural-network computer-vision resolution video-processing
我们知道深度神经网络具有固定的输入层大小,并且大多数DNN的输入层大小都小于当前的标准视频大小,例如我得到了一个经过训练的FasterRCNN模型,该模型具有max("time")个输入层大小。
max("time")
但是,高清视频的分辨率为max("time"),4K的分辨率为500x375,因此我们不得不将视频缩小到1920x1080分辨率,但是缩小操作会减少视频的细节,因为某些对象无法检测到。
500x375
1920x1080
除了缩小之外,还有什么其他方法可以使视频适应DNN的输入层?