我正在尝试使用以下格式的记录对文本文件进行排序 input.txt中:
b1 xy
a2 pq
这是我的pySpark代码:
distFile = sc.textFile(input.txt)
words = distFile.map(lambda x: [x[:2],x[2:]])
words.saveAsTextFile("output")
这就是我作为输出内容获得的内容
输出/部分-00000
[u'a2', u'pq']
[u'b1', u'xy']
我希望内容为:
a2 pq
b1 xy
我做错了什么?
当我使用words.saveAsPickleFile("output")