将正确的变量传递给R中的lm函数

时间:2015-04-12 02:48:03

标签: r function lm

我有一系列生化数据可以通过性别内的药物剂量(3个级别)进行分析,因此我使用了Eduardo Leoni in this answer to a similar question的功能建议来创建我可以继续呼吁的基础lm功能我需要分析两种药物中每种药物的近20种生化分析物。

显然,x对于每种药物都不同,y对每种分析物都不同。 z将始终是相同的数据框。

此功能正常工作:

 GrpReg <- function(x,y,z) {
   ## coef and se in a data frame
   mr <- data.frame(coef(summary(lm(y ~ x,data=z))))
   ## put row names (predictors/indep variables)
   mr$predictor <- rownames(mr)
   mr
   }

当我和女性一起测试时,它给了我正确的输出:

 GrpReg(subset(MyData$DrugE, MyData$Sex=="F"), 
      subset(MyData$Triglycerides, MyData$Sex=="F"),subset(MyData, Sex=="F"))

但是当我希望它分别为每个性别输出时,我无法使用该功能。首先我试过了:

 TriEch <- by(MyData, MyData$Sex, GrpReg(MyData$DrugE, MyData$Triglycerides))
  Show Traceback

  Rerun with Debug
  Error in summary(lm(y ~ x, data = z)) : 
   error in evaluating the argument 'object' in selecting a method for function 'summary': 
  Error in model.frame.default(formula = y ~ x, data = z, drop.unused.levels = TRUE) : 
   argument "z" is missing, with no default 

所以我修改了函数内容以包含所有变量,然后得到了这个错误:

 TriDrugE <- by(MyData, MyData$Sex, GrpReg(MyData$DrugE, MyData$Triglycerides, MyData))
 Error in FUN(X[[1L]], ...) : could not find function "FUN"

我在查找将三个变量传递给我可以复制的函数的示例时遇到了问题。

以下是一些可以使用的游戏数据:

 MyData<- as.data.frame(c(rnorm(10, 0.5, 0.1),rnorm(10, 0.6, 0.15),rnorm(10, 0.5, 0.08),rnorm(10, 0.61, 0.15),rnorm(10, 0.45, 0.11),rnorm(10, 0.55, 0.12),
    rnorm(10, 0.45, 0.12), rnorm(10, 0.45, 0.15)))
 colnames(MyData)<- "Triglycerides"
 MyData$Sex <- c(rep("F",10),rep("M",10),rep("F",10),rep("M",10),rep("F",10),rep("M",10),rep("F",10),rep("M",10))
 MyData$DrugE <- rep(c(0, 2, 4, 8), each=20)

1 个答案:

答案 0 :(得分:1)

你过分思考(容易做到)。分离出子集,不要尝试在实际的函数调用中进行。以这种方式阅读它要容易得多。而且,您可以利用内置的R公式方法,稍微修改一下您的函数。看看这是否是你需要的:

GrpReg <- function(formula, data) {
   mr <- data.frame(coef(summary(lm(formula, data))))
   mr$predictor <- rownames(mr) # you don't really need this
   return(mr)
   }

males <- subset(MyData, Sex == "M") # Subset before calling function
male_results <- GrpReg(DrugE ~ Triglycerides, males)

要处理其中几个数据集,这样的事情可能会起作用:

resp <- paste("Drug", LETTERS[5:1], sep = "")
pred <- c("Triglycerides", "LDL", "HDL", "Cholesterol", "Potassium")
forms <- paste(resp, pred, sep = "~")

doAll <- function(forms, data) { # will fail on 2nd iteration (no data)
    for (i in 1:length(forms)) {
        tmp <- GrpReg(as.formula(forms[i]), males)
        print(tmp)
        }
    }

doAll(forms, males)