对于非常大的数据框,更快版本的split {base}

时间:2017-04-26 10:28:47

标签: r dataframe

我有一个大约有三百万行的数据框(每行是一个预订)和一小部分列,其中一列是客户ID。我的目标是按客户ID将此数据框拆分为数据框列表,以便每个数据框包含客户的所有预订。所以我试过

cstmr_list <- split(df, f = df$cstmr_id)

但是半小时后取消了它因为花了太长时间。接下来,我只用

拆分索引
idx_list <- split(seq(nrow(df)), f = df$cstmr_id)

花了不到10秒。现在,我想用idx_list的相应行填充df。谁知道怎么做?

0 个答案:

没有答案