如何从RDD输出中删除括号?

时间:2016-09-10 20:43:26

标签: python apache-spark pyspark rdd

当我打印RDD时,我得到以下结果:

#targetElement

我想将RDD输出保存到没有括号或'u'符号的csv文件,类似于下面的内容:

[(46, u'15910'), (43, u'15287'), (43, u'15237'), (42, u'15923'), (41, u'15298')]

1 个答案:

答案 0 :(得分:3)

写csv:

>>> rdd.toDF().write.csv("path")

或格式:

>>> rdd.map(lambda (k, v): "{0},{1}".format(k, v)).saveAsTextFile("path")