我是R的新手,并尝试使用它。我需要得到LINEST函数等效于R。
我可以从谷歌那里获得大量至少方形的网址,但我无法获得具有常数值的网址。我想用它来进行方差分析。
例如,我想使用那些数组。首先是y,其他是虚拟变量。
y = c(42,37,41,39,43,41,37,40,39,38,41,32,28,34,32,30,33)
x1 = c(1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0)
x2 = c(0,0,0,0,0,0,1,1,1,1,1,0,0,0,0,0,0)
x3 = c(0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1)
如果LINEST的情况,我可以使用LINEST(Y1:YN,X11:X3N,TRUE)
得到结果。
P.S。在这种情况下,我应该得到如下结果:
在这种情况下,我应该得到如下结果:
答案 0 :(得分:3)
我相信您正在寻找summary(lm(y~x1+x2+x3))
,如果您知道这被称为“线性回归”,那么应该很容易找到Google。但是,您甚至不需要手动进行虚拟编码。只需使用factor
变量,让R为您完成。
summary(lm(y~x1+x2+x3))
#Call:
#lm(formula = y ~ x1 + x2 + x3)
#
#Residuals:
# Min 1Q Median 3Q Max
# -3.5 -1.5 0.5 1.5 2.5
#
#Coefficients: (1 not defined because of singularities)
# Estimate Std. Error t value Pr(>|t|)
#(Intercept) 31.5000 0.8238 38.240 1.45e-15 ***
#x1 9.0000 1.1650 7.726 2.05e-06 ***
#x2 7.5000 1.2218 6.138 2.57e-05 ***
#x3 NA NA NA NA
#---
#Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
#Residual standard error: 2.018 on 14 degrees of freedom
#Multiple R-squared: 0.8282, Adjusted R-squared: 0.8036
#F-statistic: 33.74 on 2 and 14 DF, p-value: 4.419e-06
NA
值存在,因为我们在模型中有一个截距,系统的等级不足以估计四个参数。您可以使用summary(lm(y~x1+x2+x3-1))
排除拦截,但不建议这样做。
以下是如何使用因子变量执行此操作:
x <- factor(c(1,1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,3))
summary(lm(y~x))
#Call:
#lm(formula = y ~ x)
#
#Residuals:
# Min 1Q Median 3Q Max
# -3.5 -1.5 0.5 1.5 2.5
#
#Coefficients:
# Estimate Std. Error t value Pr(>|t|)
#(Intercept) 40.5000 0.8238 49.165 < 2e-16 ***
#x2 -1.5000 1.2218 -1.228 0.24
#x3 -9.0000 1.1650 -7.726 2.05e-06 ***
#---
#Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
#
#Residual standard error: 2.018 on 14 degrees of freedom
#Multiple R-squared: 0.8282, Adjusted R-squared: 0.8036
#F-statistic: 33.74 on 2 and 14 DF, p-value: 4.419e-06
注意截距现在是x1
的平均值,其他系数与此平均值相比。