标签: apache-spark arff
我正在尝试在Apache Spark上运行一个5 GB大小的.arff文件,我想在这个文件中编辑一些数据。如何编辑.arff文件?
答案 0 :(得分:1)
您可以尝试使用arff包打开它:
arff
import arff X = [] y = [] for row in arff.load('cpu.arff'): X.append(row[:-1]) y.append(row[-1])
here是一个类似的问题。