我正在尝试在数据框列表中使用 lapply ;但没有正确传递参数(我认为)。
数据框列表:
df1 <- data.frame(A = 1:10, B= 11:20)
df2 <- data.frame(A = 21:30, B = 31:40)
listDF <- list(df1, df2,df3) #multiple data frames w. way less columns than the length of vector todos
带列名称的向量:
todos <-c('col1','col2', ......'colN')
我想使用lapply更改列名:
lapply (listDF, function(x) { colnames(x)[2:length(x)] <-todos[1:length(x)-1] } )
但这根本不会改变名字。我不是自己传递数据帧,而是其他什么?我只想更改名称,而不是将结果返回给新对象。
提前致谢,p。
答案 0 :(得分:16)
如果要替换所有列
,也可以使用setNames
df1 <- data.frame(A = 1:10, B= 11:20)
df2 <- data.frame(A = 21:30, B = 31:40)
listDF <- list(df1, df2)
new_col_name <- c("C", "D")
lapply(listDF, setNames, nm = new_col_name)
## [[1]]
## C D
## 1 1 11
## 2 2 12
## 3 3 13
## 4 4 14
## 5 5 15
## 6 6 16
## 7 7 17
## 8 8 18
## 9 9 19
## 10 10 20
## [[2]]
## C D
## 1 21 31
## 2 22 32
## 3 23 33
## 4 24 34
## 5 25 35
## 6 26 36
## 7 27 37
## 8 28 38
## 9 29 39
## 10 30 40
如果您只需要替换列名称的子集,则可以使用@Jogo
的解决方案lapply(listDF, function(df) {
names(df)[-1] <- new_col_name[-ncol(df)]
df
})
最后一点,在R中,a:b - 1和a:(b - 1)之间存在差异
1:10 - 1
## [1] 0 1 2 3 4 5 6 7 8 9
1:(10 - 1)
## [1] 1 2 3 4 5 6 7 8 9
修改强>
如果要从列表中更改全局环境中data.frame
的列名,可以使用list2env
,但我不确定这是实现您想要的最佳方式。您还需要修改列表并使用命名列表,名称应与您需要替换的data.frame
的名称相同。
listDF <- list(df1 = df1, df2 = df2)
new_col_name <- c("C", "D")
listDF <- lapply(listDF, function(df) {
names(df)[-1] <- new_col_name[-ncol(df)]
df
})
list2env(listDF, envir = .GlobalEnv)
str(df1)
## 'data.frame': 10 obs. of 2 variables:
## $ A: int 1 2 3 4 5 6 7 8 9 10
## $ C: int 11 12 13 14 15 16 17 18 19 20
答案 1 :(得分:1)
试试这个:
lapply (listDF, function(x) {
names(x)[-1] <- todos[-length(x)]
x
})
您将获得一个包含已更改数据框的新列表。如果您想直接操纵listDF
:
for (i in 1:length(listDF)) names(listDF[[i]])[-1] <- todos[-length(listDF[[i]])]
答案 2 :(得分:0)
我无法获得这些答案中使用的代码。我从另一个有效的论坛中找到了一些代码。这将为每个数据框分配新的列名,其他方法创建数据框的副本。对于其他任何人,这里是代码。
# Create some dataframes
df1 <- data.frame(A = 1:10, B= 11:20)
df2 <- data.frame(A = 21:30, B = 31:40)
listDF <- c("df1", "df2") #Notice this is NOT a list
new_col_name <- c("C", "D") #What do you want the new columns to be named?
# Assign the new column names to each dataframe in "listDF"
for(df in listDF) {
df.tmp <- get(df)
names(df.tmp) <- new_col_name
assign(df, df.tmp)
}