在Mahout中查找特征向量中的不同维度

时间:2012-03-13 15:55:28

标签: machine-learning mahout pearson

如果我使用基于相似性的算法(如皮尔逊相关分数)来比较两个特征向量 我想知道那些在特征集中非常不同的维度/特征字段然后要使用的算法是什么?我正在使用Mahout,这是一个Java的机器学习库

1 个答案:

答案 0 :(得分:1)

嗯,它只是两个向量差异最大的维度 - 其中维度中向量值的差异的绝对值最大。这真的是你的意思还是你在寻找更微妙的东西?