在函数中子集数据框

时间:2018-08-31 13:24:25

标签: r

我正在努力通过函数引用列。

获取数据:

  dat = data.frame(height = c(20, 20, 40, 50, 60, 10), weight = c(100, 200, 300, 200, 140, 240),
               age = c(19, 20, 20, 19, 10, 11))
  Age_list <- c(19)

举个例子:

toy_func <- function(df,list,column){

  for (i in list){
  toy_output <- df[,column == i]
  }

  Return(toy_output)
}

然后运行:

tst <- toy_func(dat,Age_list,"age")

输出是没有变量的数据框。我想生成一个输出,其中初始数据帧dat已被等于19岁的年龄过滤。

当我计划遍历age列中的每个唯一项时,循环是必要的。本质上,我正在编写一个函数,以按其列之一中的唯一值对数据框进行分区。

预先感谢, 约翰

2 个答案:

答案 0 :(得分:2)

使用@phiver的建议,您可以尝试以下操作:

dat = data.frame(height = c(20, 20, 40, 50, 60, 10),
                 weight = c(100, 200, 300, 200, 140, 240),
                 age = c(19, 20, 20, 19, 10, 11))
Age_list <- c(19,20)

for (i in Age_list){
  toy_output <- split(dat,dat$age==i)$`TRUE`
  print(toy_output)
  }

结果:

  height weight age
1     20    100  19
4     50    200  19
  height weight age
2     20    200  20
3     40    300  20

编辑:

您可以执行一个简单的解决方法将其放入函数中:

toy_func <- function(df,list,x){

for (i in list){
  toy_output <- split(df,df[,x]==i)$`TRUE`
  print(toy_output)
              }
           }

toy_func(dat,Age_list ,3)

  height weight age
1     20    100  19
4     50    200  19
  height weight age
2     20    200  20
3     40    300  20

EDIT2:

这将为您提供data.frame的结果,其中i列告诉您哪个迭代生成每一行:

toy_func <- function(df,list,x){
   datalist = list()
        for (i in list){
            toy_output <- data.frame(split(df,df[,3]==i)$`TRUE`)
            toy_output$i <- i
            datalist[[i]] <- toy_output
                       }
   print(do.call(rbind, datalist))
  }

toy_func(dat,Age_list ,3)

  height weight age  i
5     60    140  10 10
2     20    200  20 20
3     40    300  20 20

答案 1 :(得分:0)

您可以尝试

fnCreatedRow

如果您需要将输出作为排序列表,则可以编写

foo <- function(x, y, z) x[ x[[y]] %in% z, ]
foo(dat, "age", c(19, 20))
  height weight age
1     20    100  19
2     20    200  20
3     40    300  20
4     50    200  19