如何重命名data.frame中的单个列?

时间:2011-09-23 16:08:35

标签: r

我知道如果我的数据框超过1列,我可以使用

colnames(x) <- c("col1","col2")

重命名列。如果它只是一列,我该怎么做? 表示只有一列的矢量或数据框。

示例:

trSamp <- data.frame(sample(trainer$index, 10000))
head(trSamp )
#   sample.trainer.index..10000.
# 1                      5907862
# 2                      2181266
# 3                      7368504
# 4                      1949790
# 5                      3475174
# 6                      6062879

ncol(trSamp)
# [1] 1
class(trSamp)
# [1] "data.frame"
class(trSamp[1])
# [1] "data.frame"
class(trSamp[,1])
# [1] "numeric"
colnames(trSamp)[2] <- "newname2"
# Error in names(x) <- value : 
#   'names' attribute [2] must be the same length as the vector [1]

20 个答案:

答案 0 :(得分:489)

这是一种通用的方式,您无需记住变量的确切位置:

# df = dataframe
# old.var.name = The name you don't like anymore
# new.var.name = The name you want to get

names(df)[names(df) == 'old.var.name'] <- 'new.var.name'

这段代码几乎可以做到以下几点:

  1. names(df)查看df
  2. 中的所有名称
  3. [names(df) == old.var.name]提取您要检查的变量名称
  4. <- 'new.var.name'指定新变量名称。

答案 1 :(得分:283)

colnames(trSamp)[2] <- "newname2"

尝试设置第二列的名称。您的对象只有一列,因此该命令会引发错误。这应该足够了:

colnames(trSamp) <- "newname2"

答案 2 :(得分:77)

colnames(df)[colnames(df) == 'oldName'] <- 'newName'

答案 3 :(得分:68)

这是一个老问题,但值得注意的是,您现在可以使用setnames包中的data.table

library(data.table)

setnames(DF, "oldName", "newName")

# or since the data.frame in question is just one column: 
setnames(DF, "newName")

# And for reference's sake, in general (more than once column)
nms <- c("col1.name", "col2.name", etc...)
setnames(DF, nms)

答案 4 :(得分:49)

这也可以使用Hadley的plyr包和rename函数来完成。

library(plyr) 
df <- data.frame(foo=rnorm(1000)) 
df <- rename(df,c('foo'='samples'))

您可以按名称重命名(不知道位置)并一次执行多次重命名。例如,在进行合并之后,您可能最终得到:

  letterid id.x id.y
1       70    2    1
2      116    6    5
3      116    6    4
4      116    6    3
5      766   14    9
6      766   14   13

然后您可以使用以下步骤重命名:

letters <- rename(letters,c("id.x" = "source", "id.y" = "target"))

  letterid source target
1       70      2      1
2      116      6      5
3      116      6      4
4      116      6      3
5      766     14      9
6      766     14     13

答案 5 :(得分:27)

我认为重命名列的最佳方法是使用 dplyr 包,如下所示:

require(dplyr)
df = rename(df, new_col01 = old_col01, new_col02 = old_col02, ...)

在重命名任何数据集中的一列或多列时,它的作用相同。

答案 6 :(得分:10)

我喜欢逐个重命名数据框列名的下一个样式。

colnames(df)[which(colnames(df) == 'old_colname')] <- 'new_colname'

其中

which(colnames(df) == 'old_colname')

返回特定列的索引。

答案 7 :(得分:9)

我发现重命名单个列的最便捷方法是使用dplyr::rename_at

library(dplyr)
cars %>% rename_at("speed",~"new") %>% head     
cars %>% rename_at(vars(speed),~"new") %>% head
cars %>% rename_at(1,~"new") %>% head

#   new dist
# 1   4    2
# 2   4   10
# 3   7    4
# 4   7   22
# 5   8   16
# 6   9   10
  • 在管道链中运作良好
  • 当名称存储在变量中时很方便
  • 使用名称或列索引
  • 清晰紧凑

答案 8 :(得分:5)

您可以使用rename.vars包中的gdata

library(gdata)
df <- rename.vars(df, from = "oldname", to = "newname")

如果您要更改多个变量名称,或者想要将某些文本追加或预先添加到变量名称,则此功能特别有用,那么您可以执行以下操作:

df <- rename.vars(df, from = c("old1", "old2", "old3", 
         to = c("new1", "new2", "new3"))

有关将文本附加到变量名称子集的示例,请参阅: https://stackoverflow.com/a/28870000/180892

答案 9 :(得分:4)

尝试:

colnames(x)[2] <- 'newname2'

答案 10 :(得分:3)

这很可能已经出现了,但我正在寻找解决方案时重命名字段,并随意尝试。为我的目的而工作。

Table1$FieldNewName <- Table1$FieldOldName
Table1$FieldOldName <- NULL

编辑从这里开始......

这也有效。

df <- rename(df, c("oldColName" = "newColName"))

答案 11 :(得分:3)

你也可以试试'Hmisc'包中的'upData'。

library(Hmisc)

trSamp = upData(trSamp, rename=c(sample.trainer.index..10000. = 'newname2'))

答案 12 :(得分:2)

如果您知道您的数据框只有一列,您可以使用: names(trSamp) <- "newname2"

答案 13 :(得分:2)

让df为具有数据集myDays和temp的数据框。 如果要将“ myDays”重命名为“ Date”,

library(plyr)
rename(df,c("myDays" = "Date"))

或通过管道,您可以

dfNew      <- df %>% 
  plyr::rename(c("myDays" = "Date"))

答案 14 :(得分:0)

我只需将一个新列添加到具有所需名称的数据框中,然后从现有列中获取数据。像这样:

dataf$value=dataf$Article1Order

然后我删除旧列!像这样:

dataf$Article1Order<-NULL

此代码似乎很愚蠢!但是效果很好...

答案 15 :(得分:0)

OP的问题得到了很好的回答。但是,此方法可能在某些情况下有用:列名的部分匹配,无论其在数据框中的位置如何:

部分匹配的名称:

d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
##   name1 Reported.Cases..WHO..2011. name3
## 1    NA                         NA    NA
names(d)[grepl("Reported", names(d))] <- "name2"
##   name1 name2 name3
## 1    NA    NA    NA

另一个例子:存在“标点符号”时部分匹配:

d <- data.frame(name1 = NA, Reported.Cases..WHO..2011. = NA, name3 = NA)
##   name1 Reported.Cases..WHO..2011. name3
## 1    NA                         NA    NA
names(d)[grepl("[[:punct:]]", names(d))] <- "name2"
##   name1 name2 name3
## 1    NA    NA    NA

这些是我今天必须处理的示例,我认为可能值得分享。

答案 16 :(得分:0)

我只需使用以下代码将列名更改为具有我想要的新名称的数据集: 名称(数据集)[index_value] <-“ new_col_name”

答案 17 :(得分:0)

我发现colnames()的论点更容易

从数据框中选择一些列

df <- data.frame(df[, c( "hhid","b1005", "b1012_imp", "b3004a")

并按顺序重命名所选列,

colnames(df) <- c("hhid", "income", "cost", "credit")

检查名称和值以确保

names(df);head(df)

答案 18 :(得分:0)

我们可以使用i重命名具有某个功能的列(例如,rename_with个功能)。

请考虑以下数据stringr

df_1

df_1 <- data.frame( x = replicate(n = 3, expr = rnorm(n = 3, mean = 10, sd = 1)), y = sample(x = 1:2, size = 10, replace = TRUE) ) names(df_1) #[1] "x.1" "x.2" "x.3" "y" 重命名所有变量

dplyr::everything()

使用一些library(tidyverse) df_1 %>% rename_with(.data = ., .cols = everything(.), .fn = str_replace, pattern = '.*', replacement = str_c('var', seq_along(.), sep = '_')) %>% names() #[1] "var_1" "var_2" "var_3" "var_4" 动词(dplyrstarts_withends_withcontains,... )。

带有matches.变量)的示例:

x

通过重命名,具有许多类测试功能,例如df_1 %>% rename_with(.data = ., .cols = contains('.'), .fn = str_replace, pattern = '.*', replacement = str_c('var', seq_along(.), sep = '_')) %>% names() #[1] "var_1" "var_2" "var_3" "y" is.integeris.numeric ...

带有is.factoris.integer)的示例:

y

警告:

警告消息: 1:在stri_replace_first_regex(string,pattern,fix_replacement(replacement),中: 较长的对象长度不是较短的对象长度的倍数 2:在names [cols] <-.fn(names [cols],...)中: 要替换的项目数不是替换长度的倍数

这无关紧要,因为它只是df_1 %>% rename_with(.data = ., .cols = is.integer, .fn = str_replace, pattern = '.*', replacement = str_c('var', seq_along(.), sep = '_')) %>% names() #[1] "x.1" "x.2" "x.3" "var_1" 与replace函数的不一致。

答案 19 :(得分:-1)

library(dplyr)
rename(data, de=de.y)