Matlab / R - 带分类和线性回归的线性回归连续预测因子 - 为什么连续预测器是平方的?

时间:2017-12-09 23:41:31

标签: r matlab statistics regression linear-regression

我正在使用分类预测变量和0到1数值结果进行线性回归。 On this page我看到它建议在数字预测器与标称值一起时对其进行平方(参见Linear Regression with Categorical Predictor的第三部分)。他们给出的例子(对于Matlab,但这也概括为R)是下面的公式,其中weight是连续的,year是名义上的:

mdl = fitlm(tbl,'MPG ~ Year + Weight^2')

这是一项普遍规则吗?当我这样做时,我确实得到了更强的系数,但我想确保在没有保证的情况下我不会给它们充气。有人可以解释使用.^和数字一起使用数字的逻辑吗?

1 个答案:

答案 0 :(得分:4)

如果您分别绘制每年的mpg与重量的关系并且您看到曲率,那么重量的多项式可能有助于纠正非线性。

library(lattice)

u <- "https://raw.githubusercontent.com/shifteight/R/master/ISLR/Auto.csv"
Cars <- read.csv(u)

o <- with(Cars, order(year, weight))
xyplot(mpg ~ weight | year, Cars[o, ], type = c("p", "smooth"))

screenshot