标签: apache-spark rdd spark-graphx
由于频繁转换为庞大的数据集,因此我的代码经常创建RDD。 它内存不足。有什么办法可以销毁现有的RDD。
RDD
我有一个要使用GraphX的图形数据集。 GraphX需要vertices的{{1}}和edges。我需要经常向图添加新链接,每次都需要更新RDD和vertices的RDD时。
vertices
edges