如果我尝试一下并尝试进行采样,那么效果很好,
dft <- tibble(a=rnorm(200),b=seq.int(1,200),c=sample(LETTERS[1:26],200,replace = T))
sample_frac(dft,.5)
# A tibble: 100 x 3
a b c
<dbl> <int> <chr>
1 -0.233 58 S
2 0.0529 82 Y
3 0.371 31 S
4 0.978 136 Z
5 0.878 106 S
6 0.253 46 D
7 -1.07 16 W
8 -1.98 193 Y
9 -0.890 51 H
10 0.151 75 A
# ... with 90 more rows
但是,如果我对这个小标题进行分组,然后尝试对分组的小标题进行采样,则会返回一个空的小标题。
dft <- dft %>% group_by(c) %>% count()
sample_frac(dft,.5)
# A tibble: 0 x 2
# Groups: c [0]
# ... with 2 variables: c <chr>, n <int>
如果我将小标题强制为data.frame,则采样有效。 该问题是reported的一个错误,已在一段时间前关闭,因此我认为它很难解决。
引起这种问题的小标题和数据帧有什么不同?