我正在寻找一种通过手动输入系数来创建sparklyr :: ml_logistic_regression()模型的方法。
我创建了广泛的功能管道,这些功能假设我可以在模型对象上调用sdf_predict()函数,以便比较各种模型的性能。
创建此管道后,我被要求检查一组旧模型系数的性能,以证明附加数据所带来的改进。
一种可能的解决方法是通过mutate函数建立旧模型的预测:
myTable %>%
mutate(OldPred_Linear = CF['Intercept'] +
CF['Col_A'] * A +
CF['Col_B'] * B) %>%
mutate(OldPred = exp(OldPred_Linear ) / (1+exp(OldPred_Linear )))
上述方法的主要缺点是,我需要在我的管道中创建所有函数的“旧模型”版本,以处理这种错误的生成预测的方式。
总而言之,我正在寻找一种通过指定系数来手动构建ml_logistic_regression()对象的方法,以便可以对所得对象执行所有sdf_predict()函数。