Question

朋友.. 我有一个包含“[（1,0），（1,1），（1,0）]”行的rdd 出于这一点，我的目标是得到一个有[[1,0,1,0]]行的rdd 我已经尝试过以下代码来实现这一目标并坚持以下状态

mylist = [(1,0), (1,1), (1,0)]
myrdd = sc.parallelize(mylist)
result = myrdd.groupByKey().mapValues(list)
result.collect()

输出为：[（1，[0,1,0]）]

但我希望看到输出为[（1,0,1,0）] ..请帮助..

Answer 1

收集之前

添加行：

result = result.map(lambda (k, l): tuple([k] + l))