从小数据集中确定多个特征的融合

时间:2013-03-05 08:14:05

标签: machine-learning computer-vision

这不是一个非常具体的问题,我只是想从这个论坛的同事那里收集想法。

我的问题是;

我根据从一台摄像机收集的视频数据估算人体高度,大小和布料颜色,让我们称之为这些功能,我有一组类似于另一组数据的人,但从另一台摄像机收集。所以我想确定第二个数据集中的人是否与第一个数据集中的特征匹配(类似于重新识别),但是,我对如何将特征融合在一起以及如何匹配或排列它们感到困惑(这就像分类)。

我需要建议和建议。

2 个答案:

答案 0 :(得分:0)

您可以尝试Canonical Correlation Analysis。摘自维基页面:

实验环境中典型相关的典型用法是采用两组变量,看看两组之间的共同点。

规范相关结果的可视化通常是通过规范变量对的两组变量的系数的条形图显示出显着的相关性。一些作者建议通过将它们绘制为日光照片,使用具有光线条状的圆形格式来最佳地显示它们,每一半代表两组变量,例如: "Canonical correlation analysis: Use of composite heliographs for representing multiple patterns"

答案 1 :(得分:0)

我同意这听起来像是一个分类问题。你需要设置两个类,比如人类/非人类。

然后,您必须检查您选择的功能是否适合您的特定问题。您可以为数据库中的每个人绘制您的功能;这意味着,二维图x = feature1,y = feature2,从整数1到n为整个数据库做。它将允许您了解某个功能是否与任务相关,以便将人类与其环境进行分类。

现在,看起来你正在尝试进行二元分类:人类/非人类。 SVM适用于此类任务,但如果您不熟悉它或通常使用machine learning,则可以从更简单的算法开始,例如kNN

不要忘记在我们说[0 1]之间规范化你的数据,我认为原因很明显!一旦选择了分类算法,就必须量化算法执行任务的程度。为此,您可以尝试cross-validation(留一出......等),然后confusion matrix

玩得开心!