Question

我正在尝试使用dplyr向我的数据框添加一些列。对我来说，突变看起来很简单，但是代码似乎没有按预期运行（未在12小时以上完成）。我忍不住觉得自己在想什么...

 wcdata <- wcdata %>%
   group_by(betId) %>% 
   mutate(markets=n_distinct(MarketCode),
          states=n_distinct(State1),
          legs=n(),
          eventTypes=n_distinct(eventType)) %>%
   ungroup()

在某些情况下

wcdata数据帧约为1300万x 20
大约有500万个唯一的betId
MarketCode是一个因素，每个唯一的n_distinct（通常更少）可能有100个级别，其中betId最多为10。
State1是2个可能水平的因数
eventType是2个可能水平的因数
每个betId将有1到20 legs之间，平均约为3。

我是在做错什么，还是有另一种方法可以做我想做的事情（我认为从代码片段中可以明显看出我要实现的目标，如果我做错了，请纠正我）？

dplyr变异因看似直接的变异而卡住

0 个答案: