我有一个大型数据集,并希望根据特定的列值将其拆分为多个数据集。此列的单位是英里(例如,从1.34英里到19.92英里),我想每1/4英里拆分一次。
我需要使用子集还是拆分?
答案 0 :(得分:0)
您可以使用dplyr::ntile
,但是如文档中所述,它是“ 粗略等级,将输入向量分成n个存储桶。”
library(dplyr)
num_bins = ceiling((19.92 - 1.34)/0.25)
df %>%
mutate(bin = ntile(value, num_bins)) %>%
group_split(bin)