使用循环(或矢量化)通过向量

时间:2016-08-15 11:23:55

标签: r loops vectorization

我有3个data.frame的列表:

my_list <- list(a = data.frame(value = c(1:5), class = c(letters[1:3],"a", "b")), b = data.frame (value = c(6:1),class=c(letters[1:4],"a", "b")),c=data.frame(value = c(1:7),class = c(letters[5:1],"a", "b")))

my_list

$a
  value class
1     1     a
2     2     b
3     3     c
4     4     a
5     5     b

$b
  value class
1     6     a
2     5     b
3     4     c
4     3     d
5     2     a
6     1     b

$c
  value class
1     1     e
2     2     d
3     3     c
4     4     b
5     5     a
6     6     a
7     7     b 

我想进入每个列表,并按a列中的bclass字母对其进行分组:

wanted_sub_class <- c("a", "b")

然后将结果放在my_listclass列表中。

修改 - 预期输出:

$a class a
    value class
       1     a
       4     a

$a class b 
    value class
       2     b
       5     b

$b class a
    value class
      4     a
      2     a

$b class b
   value class
      5     b
      1     b
$c class a
  value class
    5     a
    6     b

$c class b
  value class
     4     b
     7     b

我试图用双循环来做这件事:

result <- list()

for (i in 1:length(my_list)) {
  for (j in wanted_sub_class {

    result [[i]] <- subset(my_list[[i]], my_list[[i]]$class == j)

  }
}

这应该给我6个列表元素(按照预期的输出),但它只给出3个元素b

但是,理想情况下,如果它实际可行,我希望将结果放在每my_list class的列表中。所以我想在列表中保留3个data.frames的结构,然后在列表中包含类ab的数据 - 否则,列表中的6个将起作用< /强>

我理解循环并不理想,但我无法理解(例如使用lapply)。我希望得到两个循环(如果它可能)和矢量化的答案。

2 个答案:

答案 0 :(得分:3)

  

我想进入每个列表,并按来自ab的字母对其进行分组   class

如果您希望按data.frame class列出lapply(my_list, function(x) { subset(x, class %in% c("a", "b")) }) 的列表,您可以这样做:

#$a
#  value class
#1     1     a
#2     2     b
#
#$b
#  value class
#1     4     a
#2     3     b
# 
#$c
#  value class
#4     4     b
#5     5     a

给出了:

class

更新:重新阅读您的问题后,根据我的理解,您希望按my_list重塑您的实际列表:

  

但是,理想情况下,我想将结果放在class每个列表中   library(dplyr) data.table::melt(my_list) %>% filter(class %in% c("a", "b")) %>% select(class, value) %>% split(as.character(.$class)) 但我不知道如何在循环中执行此操作。

你可以尝试:

#$a
#  class value
#1     a     1
#3     a     4
#6     a     5
#
#$b
#  class value
#2     b     2
#4     b     3
#5     b     4

给出了:

purrr

正如@Sumedeh所提到的(现已删除的评论中),您也可以使用library(purrr) my_list %>% map_df(function(x) x[x$class %in% c("a", "b"), ]) %>% split(.$class)

#$a
#  value class
#1     1     a
#3     4     a
#6     5     a

#$b
#  value class
#2     2     b
#4     3     b
#5     4     b

给出了:

<ImageView
        android:id="@+id/pointer_png"
        android:layout_width="match_parent"
        android:layout_height="match_parent"
        android:scaleType="fitCenter"
        android:adjustViewBounds="true"
        android:layout_gravity="center"
        android:src="@drawable/pointer_400" />

答案 1 :(得分:2)

如果我们使用Hadleyverse系列包中的purrr

library(purrr)
my_list %>% 
      map(~ .[.$class %in% wanted_sub_class,])
#$a
#   value class
#1     1     a
#2     2     b

#$b
#  value class
#1     4     a
#2     3     b

#$c
#  value class
#4     4     b
#5     5     a

或者输出是否只需要'a'和'b'list元素

library(dplyr)
my_list %>%
       bind_rows %>%
       filter(class %in% wanted_sub_class) %>% 
       split(., .$class)
#$a
#  value class
#1     1     a
#3     4     a
#6     5     a

#$b
#  value class
#2     2     b
#4     3     b
#5     4     b

更新

基于OP的更新

my_list %>%
       map(~ .[.$class %in% wanted_sub_class,]) %>%
       map(~split(.x, seq_len(nrow(.x)))) %>%
       do.call("c", .)
#$a.1
#  value class
#1     1     a

#$a.2
#  value class
#2     2     b

#$b.1
#  value class
#1     4     a

#$b.2
#  value class
#2     3     b

#$c.1
#  value class
#4     4     b

#$c.2
#  value class
#5     5     a

或使用bind_rows方法

my_list %>%
    bind_rows %>%
    filter(class %in% wanted_sub_class) %>% 
    split(., seq_len(nrow(.)))

UPDATE2

如果我们需要for循环

result <- setNames(vector('list', length(my_list)), names(my_list))
for(i in seq_along(my_list)){
  result[[i]] <- subset(my_list[[i]], class %in% wanted_sub_class)
  result[[i]] <- split(result[[i]], 1:nrow(result[[i]]))
 }

UPDATE3

对于新的输出格式

 my_list %>% 
     bind_rows(.id = "id")  %>%
     filter(class %in% wanted_sub_class) %>% 
     split(., list(.$id, .$class))

或使用for循环

result <- setNames(vector('list', length(my_list)), names(my_list))
for(i in seq_along(my_list)){
  result[[i]] <- subset(my_list[[i]], class %in% wanted_sub_class)
  result[[i]] <- split(result[[i]], result[[i]]$class, drop = TRUE)
}