我有一个数据集,其列为
x1 x2 x3 x4 x5 y
所有这些都具有整数/浮点值,Y值的范围为98,000到1,10,000
如果我想找到x1和y,x2和y ... x5和y之间的关系并提出
y = A.x1 + c
我应该怎么做?
我尝试绘制图表,并在R。
中尝试了lm()和fit()函数fit <- lm(Y~X1+X2+X3+X4+X5,data=data)
step <- stepAIC(fit, direction="both")
请帮助。
答案 0 :(得分:0)
我认为它应该使用一些特殊的包,找到y
和变量xi
之间的最佳线性/关系。您可以看到例如leaps
包。
您还可以通过循环遍历所有xi来找到关系。这是一种方法。 Firest我在一个函数中扭曲你的代码。我使用dot formula
表示法。
lm_col <-
function(var,data){
fit <- lm(y~.,subset(data,select=c('y',var)))
stepAIC(fit, direction="both")
}
然后使用lapply
循环遍历所有变量:
lapply(paste0('x',seq(5)),lm_col,data=dat)
您可以使用以下数据对此进行测试:
dat <- as.data.frame(matrix(rnorm(6*10),ncol=6))
colnames(dat) <- c(paste0('x',seq(5)),'y')
但正如我在开始时所说的那样,我不认为这是从统计学角度做你想做的事情(不是很清楚)的最佳方式。