标签: python numpy matrix apache-spark pyspark
我有一个稀疏矩阵(我从python函数接收),我想将其转换为numpy矩阵。 numpy矩阵不适合本地RAM,我想把它蜷缩到pySpark中的RDD中。我一般不熟悉Spark,因此我不知道如何将本地spase矩阵加载到RDD中。
答案 0 :(得分:1)
这个问题是以" pre 1.4.1 Spark知识"提交的。显然稀疏矩阵已添加到spark库中。 Spark SparseMatrix