我有以下提示:
library(tidyverse)
set.seed(1234)
df <- tibble(
x1 = letters[1:2],
y1 = list(
tibble(
x2 = letters[3:4],
y2 = list(
tibble(
x3 = seq(1, 100, 1),
y3 = rnorm(100)
)
)
)
)
)
我需要访问包含x3
和y3
的小标题中的小标题,并将自定义函数应用于每个数据帧。为简单起见,假设我需要将base::mean()
应用于y3
。
我的真实数据远不止于此,因此我正在寻找一种干净有效的方法。有什么想法吗?
答案 0 :(得分:1)
你能不能整装待发?
df %>% unnest() %>% unnest() %>%
group_by(x2) %>%
summarise(mean(y3))
# A tibble: 2 x 2
x2 `mean(y3)`
<chr> <dbl>
1 c -0.157
2 d -0.157
不确定最终数据框的外观如何,但这是另一个建议
df %>% unnest() %>%
mutate(y3.average = map(y2, ~mean(.$y3)) ) %>%
unnest(y3.average)
# A tibble: 4 x 4
x1 x2 y2 y3.average
<chr> <chr> <list> <dbl>
1 a c <tibble [100 × 2]> -0.157
2 a d <tibble [100 × 2]> -0.157
3 b c <tibble [100 × 2]> -0.157
4 b d <tibble [100 × 2]> -0.157
答案 1 :(得分:0)
您需要找到要应用该功能的级别(我通过括号索引进行此操作),然后应用该功能。我希望这可以转移到您需要做的事情。
> df[["y1"]][[1]][[2]] %>% lapply(., function(x){mean(x$y3)})
[[1]]
[1] 0.04124318
[[2]]
[1] 0.04124318