数值预测器的逻辑回归?

时间:2021-01-26 22:00:53

标签: r data-science logistic-regression data-mining

我正在处理一个数据集,并希望使用以下一些变量来预测“Operatieduur”。所有预测变量都已分解。

LogicFit <- train(Operatieduur ~ Anesthesioloog + Aorta_chirurgie + Benadering +
                    Chirurg + Operatietype, data = TrainData,
                  method="glm", family="binomial")

这里我使用 caret 包中的“train”函数来与 glm 进行逻辑拟合。当我运行此代码时,我收到错误消息:

1: model fit failed for Resample01: parameter=none Error in eval(family$initialize) : y values must be 0 <= y <= 1

我用谷歌搜索了一下,发现原因是响应“Operatieduur”是一个连续的数值(它是一个持续时间)。那么我应该如何修改函数以使用预测变量(它们都是分类值)来预测连续数值?逻辑函数能做到吗?

1 个答案:

答案 0 :(得分:2)

逻辑回归预测类别,而不是数值变量。如果要预测连续数值变量(甚至使用分类变量),请使用正态回归。根据预测变量的类别数量,您可能需要考虑一种热/虚拟编码。