pyspark:将稀疏局部矩阵转换为RDD

时间:2015-06-16 20:24:56

标签: python numpy matrix apache-spark pyspark

我有一个稀疏矩阵(我从python函数接收),我想将其转换为numpy矩阵。 numpy矩阵不适合本地RAM,我想把它蜷缩到pySpark中的RDD中。我一般不熟悉Spark,因此我不知道如何将本地spase矩阵加载到RDD中。

1 个答案:

答案 0 :(得分:1)

这个问题是以" pre 1.4.1 Spark知识"提交的。显然稀疏矩阵已添加到spark库中。 Spark SparseMatrix