rdd数据是键,值格式,值是结构数据 如何打印前100个数据,并将其保存为本地文件。
它可能是用户rdd.take(10).saveAsTextFile
,但会报告错误。
答案 0 :(得分:0)
如果您使用take
上的rdd
作为
rdd.take(10)
它会返回Array
而不是rdd
而saveAsTextFile
将无法使用数组。
您可以使用zipWithIndex
进行过滤,并将过滤保存为
rdd.zipWithIndex().filter(_._2 < 100).map(_._1).saveAsTextFile("path to the output file")
此处_._2 < 100
用于表示您要保存前100个数据