我有3个data.frame
的列表:
my_list <- list(a = data.frame(value = c(1:5), class = c(letters[1:3],"a", "b")), b = data.frame (value = c(6:1),class=c(letters[1:4],"a", "b")),c=data.frame(value = c(1:7),class = c(letters[5:1],"a", "b")))
my_list
$a
value class
1 1 a
2 2 b
3 3 c
4 4 a
5 5 b
$b
value class
1 6 a
2 5 b
3 4 c
4 3 d
5 2 a
6 1 b
$c
value class
1 1 e
2 2 d
3 3 c
4 4 b
5 5 a
6 6 a
7 7 b
我想进入每个列表,并按a
列中的b
和class
字母对其进行分组:
wanted_sub_class <- c("a", "b")
然后将结果放在my_list
每class
列表中。
修改 - 预期输出:
$a class a
value class
1 a
4 a
$a class b
value class
2 b
5 b
$b class a
value class
4 a
2 a
$b class b
value class
5 b
1 b
$c class a
value class
5 a
6 b
$c class b
value class
4 b
7 b
我试图用双循环来做这件事:
result <- list()
for (i in 1:length(my_list)) {
for (j in wanted_sub_class {
result [[i]] <- subset(my_list[[i]], my_list[[i]]$class == j)
}
}
这应该给我6个列表元素(按照预期的输出),但它只给出3个元素b
。
但是,理想情况下,如果它实际可行,我希望将结果放在每my_list
class
的列表中。所以我想在列表中保留3个data.frames的结构,然后在列表中包含类a
和b
的数据 - 否则,列表中的6个将起作用< /强>
我理解循环并不理想,但我无法理解(例如使用lapply)。我希望得到两个循环(如果它可能)和矢量化的答案。
答案 0 :(得分:3)
我想进入每个列表,并按来自
a
和b
的字母对其进行分组class
列
如果您希望按data.frame
class
列出lapply(my_list, function(x) { subset(x, class %in% c("a", "b")) })
的列表,您可以这样做:
#$a
# value class
#1 1 a
#2 2 b
#
#$b
# value class
#1 4 a
#2 3 b
#
#$c
# value class
#4 4 b
#5 5 a
给出了:
class
更新:重新阅读您的问题后,根据我的理解,您希望按my_list
重塑您的实际列表:
但是,理想情况下,我想将结果放在
class
每个列表中library(dplyr) data.table::melt(my_list) %>% filter(class %in% c("a", "b")) %>% select(class, value) %>% split(as.character(.$class))
但我不知道如何在循环中执行此操作。
你可以尝试:
#$a
# class value
#1 a 1
#3 a 4
#6 a 5
#
#$b
# class value
#2 b 2
#4 b 3
#5 b 4
给出了:
purrr
正如@Sumedeh所提到的(现已删除的评论中),您也可以使用library(purrr)
my_list %>%
map_df(function(x) x[x$class %in% c("a", "b"), ]) %>%
split(.$class)
:
#$a
# value class
#1 1 a
#3 4 a
#6 5 a
#$b
# value class
#2 2 b
#4 3 b
#5 4 b
给出了:
<ImageView
android:id="@+id/pointer_png"
android:layout_width="match_parent"
android:layout_height="match_parent"
android:scaleType="fitCenter"
android:adjustViewBounds="true"
android:layout_gravity="center"
android:src="@drawable/pointer_400" />
答案 1 :(得分:2)
如果我们使用Hadleyverse系列包中的purrr
library(purrr)
my_list %>%
map(~ .[.$class %in% wanted_sub_class,])
#$a
# value class
#1 1 a
#2 2 b
#$b
# value class
#1 4 a
#2 3 b
#$c
# value class
#4 4 b
#5 5 a
或者输出是否只需要'a'和'b'list
元素
library(dplyr)
my_list %>%
bind_rows %>%
filter(class %in% wanted_sub_class) %>%
split(., .$class)
#$a
# value class
#1 1 a
#3 4 a
#6 5 a
#$b
# value class
#2 2 b
#4 3 b
#5 4 b
基于OP的更新
my_list %>%
map(~ .[.$class %in% wanted_sub_class,]) %>%
map(~split(.x, seq_len(nrow(.x)))) %>%
do.call("c", .)
#$a.1
# value class
#1 1 a
#$a.2
# value class
#2 2 b
#$b.1
# value class
#1 4 a
#$b.2
# value class
#2 3 b
#$c.1
# value class
#4 4 b
#$c.2
# value class
#5 5 a
或使用bind_rows
方法
my_list %>%
bind_rows %>%
filter(class %in% wanted_sub_class) %>%
split(., seq_len(nrow(.)))
如果我们需要for
循环
result <- setNames(vector('list', length(my_list)), names(my_list))
for(i in seq_along(my_list)){
result[[i]] <- subset(my_list[[i]], class %in% wanted_sub_class)
result[[i]] <- split(result[[i]], 1:nrow(result[[i]]))
}
对于新的输出格式
my_list %>%
bind_rows(.id = "id") %>%
filter(class %in% wanted_sub_class) %>%
split(., list(.$id, .$class))
或使用for
循环
result <- setNames(vector('list', length(my_list)), names(my_list))
for(i in seq_along(my_list)){
result[[i]] <- subset(my_list[[i]], class %in% wanted_sub_class)
result[[i]] <- split(result[[i]], result[[i]]$class, drop = TRUE)
}