在R函数中,将数据框对象指定为名称?循环功能

时间:2017-05-10 04:36:13

标签: r function loops dataframe

我的问题有两个问题。首先,给出这三个数据框:

df1 <- data.frame(k1 = runif(6, min=0, max=100), 
             k2 = runif(6, min=0, max=100), 
             k3 = runif(6, min=0, max=100), 
             k4 = runif(6, min=0, max=100))
df2 <- data.frame(k1 = runif(6, min=0, max=100), 
              k2 = runif(6, min=0, max=100), 
              k3 = runif(6, min=0, max=100), 
              k4 = runif(6, min=0, max=100))
df3 <- data.frame(k1 = runif(6, min=0, max=100), 
              k2 = runif(6, min=0, max=100), 
              k3 = runif(6, min=0, max=100), 
              k4 = runif(6, min=0, max=100))

我想使用此函数重新格式化并重命名每个数据框的一部分:

samplelist<-c("k2", "k4")

draft_fxn<-function(x, obj_name){
  x.selected<-x[,c(samplelist)] #select columns of choice
  colnames(x.selected)[1:2]<-paste(obj_name, colnames(x.selected), sep="_") #rename columns so they include original data frame name
  return(x.selected)
}

#Example run and output:
df2_final<-draft_fxn(df2, "df2")
#output from:
head(df2_final[1:2],)
>     df2_k2   df2_k4
>1  5.240274 53.03423
>2  5.042926 34.78974

第一个问题:如何更改我的功能,所以我不必输入'df2,'df2“'。在我的draft_fxn代码中,我想用输入数据框的名称替换“obj_name”。在我的例子中,它是“df2”。

第二个问题:我如何遍历所有数据框?也许,类似于这个for循环?     objs&lt; -c(df1,df2,df3)

for (file in objs){
  out<-draft_fxn(file); return(out)
} #this doesn't work though. 

2 个答案:

答案 0 :(得分:3)

要回答您的第一个问题:您可以使用x获取对象deparse(substitute(x))的名称。因此,要从函数中消除参数obj_name,可以使用

draft_fxn <- function(x){
    obj_name <- deparse(substitute(x))
    x.selected<-x[,c(samplelist)]
    colnames(x.selected)[1:2]<-paste(obj_name, colnames(x.selected), sep="_") #rename columns so they include original data frame name
    return(x.selected)
}  

关于你的第二个问题,如果你想对多个数据帧执行这样的操作,你通常会把它们放在一个列表中然后lapply这个函数。但是,在这种情况下,它不起作用,因为如果将数据帧放入列表中,对象名称会更改,即deparse(substitute(x))返回X[[i]]_而不是单个数据帧的名称。如果您想在循环中执行此操作,我建议您使用不同的方法传递数据框名称的向量:

## Names of the relevant data frames:
objNames <- c("df1", "df2", "df3")
## Function to rename the specified columns:
renameFun <- function(xString){
    x <- get(xString)[,c(samplelist)]
    colnames(x) <- paste(xString, samplelist, sep = "_")
    x   
}

## Apply function to all data frames specifed by objNames:
lapply(objNames, renameFun) 
# [[1]]
#      df1_k2    df1_k4
# 1 54.232123  2.178375
# 2 16.816784 23.586760
# 3  6.612874 16.509340
# 4 92.399588 71.133637
# 5 22.917838  8.127079
# 6 43.563411 21.118758
# 
# ...

答案 1 :(得分:2)

所以你的函数没有明确指定,因为你在函数之外定义samplelist然后在里面调用它。问题在于,如果您没有定义samplelist,该函数将返回错误,即它不是自包含的。

这是另一种选择:

  draft_fxn<-function(x, cols =...){
  x.selected<-data.frame(x[, cols]) #select columns of choice
  colnames(x.selected)<-paste(deparse(substitute(x)), colnames(x.selected), sep="_") #rename columns so they include original data frame name
  return(x.selected)
}

请注意,cols参数可能会有所不同(只要它是正数且不大于数据框中的列数)。

返回:

> df2_final<- draft_fxn(df2, cols = c("k2", "k4"))
> head(df2_final)[1:2,]
    df2_k2    df2_k4
1 21.62533  2.256182
2 64.83556 67.705705