从数据框-R中提取特定类型列和特定命名列

时间:2016-05-11 19:01:38

标签: r dataframe apply

让我有一个数据框,其中一些colums rae因子类型,并且有一个名为" index"这不是一个专栏。我想提取列

  • 是因素tyepe和
  • "索引"列。

例如,让

df<-data.frame(a=runif(10),b=as.factor(sample(10)),index=as.numeri(1:10))

所以df是:

         a  b index
0.16187501  5     1
0.75214741  8     2
0.08741729  3     3
0.58871514  2     4
0.18464752  9     5
0.98392420  1     6
0.73771960 10     7
0.97141474  6     8
0.15768011  7     9
0.10171931  4    10

所需的输出是(让它成为名为df1的数据帧)

DF1:

   b index
   5     1
   8     2
   3     3
   2     4
   9     5
   1     6
  10     7
   6     8
   7     9
   4    10

由factor列和名为&#34; index&#34;。

的列组成

我使用这样的代码

  vars<-apply(df,2,function(x) {(is.factor(x)) || (names(x)=="index")})

  df1<-df[,vars]

但是,此代码不起作用。如何在R中使用apply types函数返回df1?我会很高兴得到任何帮助。非常感谢。

1 个答案:

答案 0 :(得分:2)

你可以这样做:

df[ , sapply(df, is.factor) | grepl("index", names(df))]

我认为您的方法出了两个问题:首先,apply将数据框转换为矩阵,而矩阵不会将值存储为因子(有关详细信息,请参阅here)。此外,在矩阵中,每个值必须是相同的模式(字符,数字等)。在这种情况下,所有东西都被强制转换为角色,因此找不到任何因素。

其次,apply(AFAIK)无法访问列名,因此names(x)返回NULLnames(x)=="index"返回logical(0)