应用错误收集

这个问题已经与生成性逆境网络（GAN）和具有相当程度成功的RNN一起解决。

Facebook AI Research here引入的一种使用GAN的相当成功的方法使用了多尺度生成器。基本上，您以不同的比例对图像进行采样，然后预测该特定较低分辨率的下一帧。然后使用上采样预测帧和下一个更高分辨率的原始帧，您可以预测该更高比例的下一帧，并继续该过程。多尺度聚合有助于防止模糊并保留细节。您可以找到代码here

最近的方法使用自动编码器和GAN的组合，基本上变分编码器将整个视频流循环压缩到潜在空间，并且您有不同的网络来预测流和来自潜在空间表示的下一帧。然后它将下一帧与预测流量的信息融合在一起。您可以阅读论文here了解详情。

康奈尔的另一种方法，没有GAN这样做。它相当复杂，但简单来说它们使用Stacked LSTM，并将错误信号传播到更多的LSTM层，然后它们的工作就是预测下一帧的错误。这是paper

还有其他方法，但这些方法似乎被广泛引用，并且可以在线获取代码。

用keras进行图像序列预测

1 个答案: