我将我在python中完成的一些东西移植到R中,并且我的很多scikit模型都使用这种类型的公式。它在我的用例中很有用,因为我使用的数据框通常具有许多变量/功能。在R中,大多数指南建议使用诸如
之类的公式来建立模型lm(y~x1+x2+x3...)
如果我使用高维数据框执行此操作,则会很快变得混乱。我已经弄清楚如何构建一个包含许多变量的公式
form <- as.formula(paste0('~', paste(names(df), collapse='+')
我用y来结束这个以创建完整的公式。是否可以只为模型提供响应变量向量和类似于以下的预测变量矩阵?
lm(y,X) or lm(y~X)