应用错误收集

在45000x800矩阵的SVD上使用PySpark

时间：2015-04-17 23:15:06

标签： svd

我正在使用pySpark对大尺寸数据（45000x800）执行SVD。有没有办法在将数据保存为RDD的同时执行此操作？我相信mlLib中有一个函数，但它只适用于scala和java。

如果没有，那么使用numpy的最佳方法是什么？

0 个答案:

没有答案