在R中找到变量关系

时间:2014-05-17 11:11:30

标签: r regression linear-regression regression-testing

我有一个数据集,其列为

x1 x2 x3 x4 x5 y

所有这些都具有整数/浮点值,Y值的范围为98,000到1,10,000

如果我想找到x1和y,x2和y ... x5和y之间的关系并提出

y = A.x1 + c

我应该怎么做?

我尝试绘制图表,并在R。

中尝试了lm()和fit()函数
fit <- lm(Y~X1+X2+X3+X4+X5,data=data)
step <- stepAIC(fit, direction="both")

请帮助。

1 个答案:

答案 0 :(得分:0)

我认为它应该使用一些特殊的包,找到y和变量xi之间的最佳线性/关系。您可以看到例如leaps包。

您还可以通过循环遍历所有xi来找到关系。这是一种方法。 Firest我在一个函数中扭曲你的代码。我使用dot formula表示法。

lm_col <-
  function(var,data){
    fit <- lm(y~.,subset(data,select=c('y',var)))
    stepAIC(fit, direction="both")
  }

然后使用lapply循环遍历所有变量:

 lapply(paste0('x',seq(5)),lm_col,data=dat)

您可以使用以下数据对此进行测试:

dat <- as.data.frame(matrix(rnorm(6*10),ncol=6))
colnames(dat) <- c(paste0('x',seq(5)),'y')

但正如我在开始时所说的那样,我不认为这是从统计学角度做你想做的事情(不是很清楚)的最佳方式。