标签: python apache-spark pyspark rdd
我有一个文本文件,其中三列由制表符或空格分隔,作为分隔符。例如,
User_ID
如何使用python将数据集加载到RDD中?
到目前为止,我已经尝试过:
12345 1232334 132 14323 8343984 234 12443 2342345 345 23234 2343556 234
我是python和spark的新手,所以我们将不胜感激。
谢谢