Question

我正在处理一个数据集，并希望使用以下一些变量来预测“Operatieduur”。所有预测变量都已分解。

LogicFit <- train(Operatieduur ~ Anesthesioloog + Aorta_chirurgie + Benadering +
                    Chirurg + Operatietype, data = TrainData,
                  method="glm", family="binomial")

这里我使用 caret 包中的“train”函数来与 glm 进行逻辑拟合。当我运行此代码时，我收到错误消息：

1: model fit failed for Resample01: parameter=none Error in eval(family$initialize) : y values must be 0 <= y <= 1

我用谷歌搜索了一下，发现原因是响应“Operatieduur”是一个连续的数值（它是一个持续时间）。那么我应该如何修改函数以使用预测变量（它们都是分类值）来预测连续数值？逻辑函数能做到吗？

Answer 1

逻辑回归预测类别，而不是数值变量。如果要预测连续数值变量（甚至使用分类变量），请使用正态回归。根据预测变量的类别数量，您可能需要考虑一种热/虚拟编码。

数值预测器的逻辑回归？

1 个答案: