使用dplyr为每个组采样具有不同样本大小的子行行

时间:2018-03-22 17:25:00

标签: r dplyr aggregate tidyverse

我已经看到了this问题的答案,但我有K个小组,每个小组都有n[k]个元素,我想从中绘制floor(n[k] * p)个示例这些小组中的每一个。

我在想这样的事情:

df %>%
  group_by(my_group) %>%
  mutate(
    n_samples = floor(n() / 2)
  ) %>%
  sample_n(n_samples)

但这并不起作用,因为sample_n的论点应该对每个群体都相同。

我更喜欢使用dplyr或至少遵循tidyverse约定的解决方案。

0 个答案:

没有答案