在几个数据框中创建新列,其值取决于数据框的名称

时间:2018-09-23 12:11:18

标签: r list loops dataframe

我在R中有几个名称相似的数据帧。我正在寻找一种简洁的方法在这些数据帧的每一个中创建新列。这些列中的值应取决于数据框的名称。

我有:

dfARCHIMEDES
    var1   var2
     a      b
     c      d

dfPYTHAGORAS
    var1   var2
     e      f
     g      h

它应该变成:

dfARCHIMEDES
    var1   var2   newvar
     a      b      ARCHIMEDES
     c      d      ARCHIMEDES

dfPYTHAGORAS
    var1   var2   newvar
     e      f      PYTHAGORAS
     g      h      PYTHAGORAS

不用说,如果数据如此简单,那将是一件容易的事。但是,我目前大约有250个数据帧,每个数据帧有15列和500行。

感谢您的帮助。

2 个答案:

答案 0 :(得分:2)

您可以通过以下方式进行处理。查看代码中的注释。

# make some sample data (which OP should provide...)
dfARCHIMEDES <- data.frame(var1 = c("a", "c"),
                           var2 = c("b", "d"))
dfPYTHAGORAS <- data.frame(var1 = c("e", "g"),
                           var2 = c("g", "h"))

# collect all object names that start with a "df" from your workspace
get.dfs <- ls(pattern ="^df")

# go through each data.frame
for (i in get.dfs) {
  tmp <- get(i) # save the data.frame into a temporary variable
  newname <- gsub("^df", "", i) # remove the df part from the name
  tmp$newvar <- newname # create new variable with the new name
  assign(i, tmp) # re-write the data.frame
}

> dfARCHIMEDES
  var1 var2     newvar
1    a    b ARCHIMEDES
2    c    d ARCHIMEDES
> dfPYTHAGORAS
  var1 var2     newvar
1    e    g PYTHAGORAS
2    g    h PYTHAGORAS

答案 1 :(得分:0)

您可以通过执行以下操作来获得具有全局环境中所有数据帧名称的向量:

library(dplyr)

df_names <- 
  sapply(.GlobalEnv, is.data.frame) %>% 
  which() %>% 
  names()

在那之后,循环将达到目的:

for (i in df_names) {
  assign(i, cbind(get(i), newvar = i))
}