手动输入模型系数

时间:2019-07-28 12:12:30

标签: r apache-spark sparklyr

我正在寻找一种通过手动输入系数来创建sparklyr :: ml_logistic_regression()模型的方法。

我创建了广泛的功能管道,这些功能假设我可以在模型对象上调用sdf_predict()函数,以便比较各种模型的性能。

创建此管道后,我被要求检查一组旧模型系数的性能,以证明附加数据所带来的改进。

一种可能的解决方法是通过mutate函数建立旧模型的预测:

myTable %>% 
    mutate(OldPred_Linear = CF['Intercept'] + 
                            CF['Col_A'] * A +
                            CF['Col_B'] * B) %>%
    mutate(OldPred = exp(OldPred_Linear ) / (1+exp(OldPred_Linear )))

上述方法的主要缺点是,我需要在我的管道中创建所有函数的“旧模型”版本,以处理这种错误的生成预测的方式。

总而言之,我正在寻找一种通过指定系数来手动构建ml_logistic_regression()对象的方法,以便可以对所得对象执行所有sdf_predict()函数。

0 个答案:

没有答案