如何量化具有2个变量的数据集之间的依存关系?

时间:2019-11-26 19:29:19

标签: matlab signals correlation similarity

我的最终目标是在知道代理的2D位置的情况下估计目标的2D位置(图像上的蓝色信号)。现在,我有两种可能的替代方法(红色和黄色信号),并且在构建模型之前,我想先评估哪个对目标信号的依赖性最大。我想量化这种关系的强度,换句话说,就是评估哪种替代方法可以为我提供有关目标的更多信息。

image representing the 2D positions of target and surrogates in time

我几乎都听说过相互信息,相关性和相似性。

出于相似性,我可以将每个数据集标准化并使用PCA旋转它们,最后使用一些距离度量来比较它们,但是似乎并不能真正解决问题,因为存在来自不同对象的信号。而且,它对出现在我的数据中的滞后或相位差很敏感。

我尝试了multiple correlation,它衡量了可以从一组其他变量(代理的x y)预测变量(对象的x或y)的程度),但仅表示线性关系。如果代理与对象之间具有很强的非线性关系,而另一个代理具有较弱但线性的关系,则这种比较将是不公平的。

按照定义,多元互信息似乎是我正在寻找的信息,但它需要有关分布的信息。我已经读过可以使用垃圾箱中的计数来估计它们,但恐怕我没有足够的数据,而且还取决于垃圾箱大小的选择。

您知道其他指标吗?也许在频域?它必须同时使用x和y位置。

0 个答案:

没有答案