在45000x800矩阵的SVD上使用PySpark

时间:2015-04-17 23:15:06

标签: svd

我正在使用pySpark对大尺寸数据(45000x800)执行SVD。有没有办法在将数据保存为RDD的同时执行此操作?我相信mlLib中有一个函数,但它只适用于scala和java。

如果没有,那么使用numpy的最佳方法是什么?

0 个答案:

没有答案