标签: machine-learning mahout pearson
如果我使用基于相似性的算法(如皮尔逊相关分数)来比较两个特征向量 我想知道那些在特征集中非常不同的维度/特征字段然后要使用的算法是什么?我正在使用Mahout,这是一个Java的机器学习库
答案 0 :(得分:1)
嗯,它只是两个向量差异最大的维度 - 其中维度中向量值的差异的绝对值最大。这真的是你的意思还是你在寻找更微妙的东西?