标签: pyspark
我需要将RDD拆分为训练,验证和测试集 - 我正在使用randomSplit方法来完成它。我有三个问题:
(trainData,valData,testData)= dataRDD.randomSplit([0.6,0.2,0.2])
答案 0 :(得分:1)