用于训练此数据的训练算法

时间:2014-06-02 10:45:58

标签: image-processing machine-learning neural-network matlab genetic-algorithm

我在MATLAB工作

图表

注意:此处,绘制的数据是整个 FIRST 帧位置x - position的像素的(i,j)轨迹帧。这意味着第一帧中的(23,87)处的像素在序列的末尾具有x-position作为35(如图中可见)。

以下是x_pos的一些典型情节,用于(i,j)的某些不同值。 (i,j)指的是第一帧中(i,j)处的像素并非遍及所有帧

适用于(i,j) = (23 ,87)

(i,j) = (42 ,56)

(i,j) = (67 ,19) enter image description here

2 个答案:

答案 0 :(得分:2)

视频就像一系列真实物体的照片 而在镜头前的真实物体只能做两件不同的事情:

  1. 他们静止不动
  2. 他们搬家
  3. 如果您尝试预测的像素来自视频,那么您需要查看广告在屏幕上移动像素的方式,因为对象正在屏幕上移动。

    这就是视频编解码器压缩的工作方式(H264,H265 ......)(显然视频压缩算法要复杂得多,只是试图理解像素的方向...... :-))

    以下是stackoverflow上的一些问题/答案可能会对您有所帮助:

答案 1 :(得分:2)

所以它不是关于图像中的像素,而是关于移动物体的更多信息,这使得任务更容易处理。您的数据确实是时间序列,因此时间感知算法更可取。马尔可夫模型(特别是马尔可夫链和更复杂的隐马尔可夫模型)是它们的经典例子。

但是,由于相机不稳定,您的输入嘈杂。因此,更好的解决方案是使用类似于HMM的Kalman filter - 模型,但具有明确的噪声概念。它广泛用于机器人,导航和类似区域,以根据不精确的传感器数据和历史信息估计当前和预测车辆的未来位置。它听起来与你需要的相似吗?

我对Matlab并不是很有趣,但它似乎有kalman函数来实现所提到的过滤器。