我在R中有几个名称相似的数据帧。我正在寻找一种简洁的方法在这些数据帧的每一个中创建新列。这些列中的值应取决于数据框的名称。
我有:
dfARCHIMEDES
var1 var2
a b
c d
dfPYTHAGORAS
var1 var2
e f
g h
它应该变成:
dfARCHIMEDES
var1 var2 newvar
a b ARCHIMEDES
c d ARCHIMEDES
dfPYTHAGORAS
var1 var2 newvar
e f PYTHAGORAS
g h PYTHAGORAS
不用说,如果数据如此简单,那将是一件容易的事。但是,我目前大约有250个数据帧,每个数据帧有15列和500行。
感谢您的帮助。
答案 0 :(得分:2)
您可以通过以下方式进行处理。查看代码中的注释。
# make some sample data (which OP should provide...)
dfARCHIMEDES <- data.frame(var1 = c("a", "c"),
var2 = c("b", "d"))
dfPYTHAGORAS <- data.frame(var1 = c("e", "g"),
var2 = c("g", "h"))
# collect all object names that start with a "df" from your workspace
get.dfs <- ls(pattern ="^df")
# go through each data.frame
for (i in get.dfs) {
tmp <- get(i) # save the data.frame into a temporary variable
newname <- gsub("^df", "", i) # remove the df part from the name
tmp$newvar <- newname # create new variable with the new name
assign(i, tmp) # re-write the data.frame
}
> dfARCHIMEDES
var1 var2 newvar
1 a b ARCHIMEDES
2 c d ARCHIMEDES
> dfPYTHAGORAS
var1 var2 newvar
1 e g PYTHAGORAS
2 g h PYTHAGORAS
答案 1 :(得分:0)
您可以通过执行以下操作来获得具有全局环境中所有数据帧名称的向量:
library(dplyr)
df_names <-
sapply(.GlobalEnv, is.data.frame) %>%
which() %>%
names()
在那之后,循环将达到目的:
for (i in df_names) {
assign(i, cbind(get(i), newvar = i))
}