标签: svd
我正在使用pySpark对大尺寸数据(45000x800)执行SVD。有没有办法在将数据保存为RDD的同时执行此操作?我相信mlLib中有一个函数,但它只适用于scala和java。
如果没有,那么使用numpy的最佳方法是什么?