我有RDD
list
个unicode
个数据,如:
[[u'2002-03-31',u'emp1',u'20000'],[u'2002-05-11',u'emp2',u'23050'],[u'2002-05-17',u'emp1',u'23300']...]
我希望将其转换为RDD
tuple
,如:
[(u'2002-03-31',u'emp1',u'20000'),(u'2002-05-11',u'emp2',u'23050'),(u'2002-05-17',u'emp1',u'23300')...]
怎么做?
答案 0 :(得分:2)
您只需使用tuple
:
rdd = sc.parallelize([
[u'2002-03-31', u'emp1', u'20000'],
[u'2002-05-11', u'emp2', u'23050'],
[u'2002-05-17', u'emp1', u'23300']])
tuples = rdd.map(tuple)
tuples.first()
## ('2002-03-31', 'emp1', '20000')