dplyr变异因看似直接的变异而卡住

时间:2018-07-15 07:23:59

标签: r group-by dplyr mutate

我正在尝试使用dplyr向我的数据框添加一些列。对我来说,突变看起来很简单,但是代码似乎没有按预期运行(未在12小时以上完成)。我忍不住觉得自己在想什么...

 wcdata <- wcdata %>%
   group_by(betId) %>% 
   mutate(markets=n_distinct(MarketCode),
          states=n_distinct(State1),
          legs=n(),
          eventTypes=n_distinct(eventType)) %>%
   ungroup()

在某些情况下

  • wcdata数据帧约为1300万x 20
  • 大约有500万个唯一的betId
  • MarketCode是一个因素,每个唯一的n_distinct(通常更少)可能有100个级别,其中betId最多为10。
  • State1是2个可能水平的因数
  • eventType是2个可能水平的因数
  • 每个betId将有1到20 legs之间,平均约为3。

我是在做错什么,还是有另一种方法可以做我想做的事情(我认为从代码片段中可以明显看出我要实现的目标,如果我做错了,请纠正我)?

0 个答案:

没有答案