标签: apache-spark apache-spark-ml
我正在使用spark ml建立一个Logistic回归模型。我已手动将数据拆分为培训,验证和测试集。我想使用ParamGridBuilder并进行一些参数调整,但使用我的验证数据。 TrainValidationSplit和CrossValidator都会随机分割数据以进行验证,认为它对我没用,因为我手动创建了验证集。如何使用自己的验证集进行参数调整?我还可以使用ParamGridBuilder吗?
ParamGridBuilder
TrainValidationSplit
CrossValidator