从数据框中提取特定列

时间:2012-04-10 02:24:04

标签: r dataframe

我有一个包含6列的R数据框,我想创建一个只有三列的新数据框。

假设我的数据框是df,我想要提取列ABE,这是我能找到的唯一命令:< / p>

 data.frame(df$A,df$B,df$E)

有更紧凑的方法吗?

10 个答案:

答案 0 :(得分:417)

您可以使用列名矢量进行子集化。我强烈建议使用这种方法,而不是将列名称视为对象名称(例如subset()),尤其是在函数,包或应用程序中进行编程时。

# data for reproducible example
# (and to avoid confusion from trying to subset `stats::df`)
df <- setNames(data.frame(as.list(1:5)), LETTERS[1:5])
# subset
df[,c("A","B","E")]

答案 1 :(得分:102)

使用dplyr包,如果您的data.frame被调用df1

library(dplyr)

df1 %>%
  select(A, B, E)

这也可以在没有%>%管道的情况下编写:

select(df1, A, B, E)

答案 2 :(得分:89)

这是subset()功能的作用:

> dat <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> subset(dat, select=c("A", "B"))
  A B
1 1 3
2 2 4

答案 3 :(得分:65)

有两个明显的选择:Joshua Ulrich的df[,c("A","B","E")]

df[,c(1,2,5)]

,如

> df <- data.frame(A=c(1,2),B=c(3,4),C=c(5,6),D=c(7,7),E=c(8,8),F=c(9,9)) 
> df
  A B C D E F
1 1 3 5 7 8 9
2 2 4 6 7 8 9
> df[,c(1,2,5)]
  A B E
1 1 3 8
2 2 4 8
> df[,c("A","B","E")]
  A B E
1 1 3 8
2 2 4 8

答案 4 :(得分:11)

您还可以使用sqldf包对R数据帧执行选择:

df1 <- sqldf("select A, B, E from df")

这为输出提供了一个数据框df1,其中包含列:A,B,E。

答案 5 :(得分:10)

仅出于某种原因

df[, (names(df) %in% c("A","B","E"))]

为我工作。所有上述语法都选择了&#34;未定义的列&#34;。

答案 6 :(得分:7)

其中df1是您的原始数据框:

df2 <- subset(df1, select = c(1, 2, 5))

答案 7 :(得分:0)

[和子集不可替代:

如果只选择了一列,

[会返回一个向量。

df = data.frame(a="a",b="b")    

identical(
  df[,c("a")], 
  subset(df,select="a")
) 

identical(
  df[,c("a","b")],  
  subset(df,select=c("a","b"))
)

答案 8 :(得分:0)

您可以使用with

with(df, data.frame(A, B, E))

答案 9 :(得分:0)

df<- dplyr::select ( df,A,B,C)

此外,您可以为新创建的数据分配其他名称

data<- dplyr::select ( df,A,B,C)