标签: python pyspark
假设我有一个清单:
x = [[1,10],[2,14],[3,17]]
我想将x转换为包含两列id(1,2,3)和value(10,14,17)的Spark数据帧。
x
id
value
我怎么能这样做?
由于
答案 0 :(得分:3)
x = [[1,10],[2,14],[3,17]] df = sc.parallelize(x).toDF(['ID','VALUE']) df.show()