在apache spark中使用相似性函数和RowMatrix

时间:2015-03-19 08:45:33

标签: java apache-spark similarity apache-spark-mllib

我需要计算从RowMatrix计算的平均向量与同一RowMatrix内的所有向量之间的相似性。

要计算平均向量,我正在这样做(例如在Java中):

RowMatrix matrix = new RowMatrix(vectorOfUserToItems.rdd());
Vector meanVector = matrix.computeColumnSummaryStatistics().mean();

如何将此向量添加到RowMatrix“矩阵”中,以便我可以计算相似度,或者我应该以某种方式做到不同?

0 个答案:

没有答案