在Python Spark中将数据从纺织品加载到RDD

时间:2019-01-24 15:47:51

标签: python apache-spark pyspark rdd

我有一个文本文件,其中三列由制表符或空格分隔,作为分隔符。例如,

User_ID

如何使用python将数据集加载到RDD中?

到目前为止,我已经尝试过:

 12345 1232334 132

 14323 8343984        234

 12443     2342345      345

 23234 2343556 234

我是python和spark的新手,所以我们将不胜感激。

谢谢

0 个答案:

没有答案