根据R中数据框中的现有行分配标题

时间:2014-01-06 17:52:43

标签: r dataframe names

转换数据框后,我想根据现有行为列分配头/名称。 我的标题目前是:

row.names   X2  X3  X4  X5  X6  X7  X8  X9  ...

我想摆脱它并使用以下行作为列标题(因为我有很多,所以不必输入它们。)

我唯一的解决方案是导出和重新加载数据(标题= T)。

5 个答案:

答案 0 :(得分:52)

这里的关键是首先取消行。

colnames(DF) <- as.character(unlist(DF[1,]))
DF = DF[-1, ]

答案 1 :(得分:51)

试试这个:

colnames(DF) = DF[1, ] # the first row will be the header
DF = DF[-1, ]          # removing the first row.

但是,请查看数据是否已正确读取。如果data.frame有数字变量但第一行是字符,则所有数据都被读作字符。为避免此问题,最好保存数据并按照建议使用header = TRUE再次读取。您还可以查看此问题:Reading a CSV file organized horizontally

答案 2 :(得分:3)

最干净的方法是使用为此目的而构建的janitor软件包功能。

janitor::row_to_names(DF,1)

如果要使用第一行以外的任何其他行,请在第二个参数中传递它。

答案 3 :(得分:0)

与Vishnu的答案非常相似,但使用lapply将所有数据映射到字符然后将它们指定为标题。如果您的数据作为因素导入,这非常有用。

DF[] <- lapply(DF, as.character)
colnames(DF) <- DF[1, ]
DF <- DF[-1 ,]

请注意,如果您有大量数字数据或因素,则需要将其转换回来。在这种情况下,存储字符数据框,提取所需的行,然后将其应用于原始数据框可能是有意义的

tempDF <- DF
tempDF[] <- lapply(DF, as.character)
colnames(DF) <- tempDF[1, ]
DF <- DF[-1 ,]
tempDF <- NULL

答案 4 :(得分:-1)

使用dplyr和tidyr的新答案:

提取所需的列名称并转换为列表

library(tidyverse)

col_names <- raw_dta %>% 
  slice(2) %>%
  pivot_longer(
    cols = "X2":"X10", # until last named column
    names_to = "old_names",
    values_to = "new_names") %>% 
  pull(new_names)

删除错误的行并添加正确的列名

dta <- raw_dta %>% 
  slice(-1, -2) %>% # Removes the rows containing new and original names
  set_names(., nm = col_names)