我正在尝试使用dplyr
向我的数据框添加一些列。对我来说,突变看起来很简单,但是代码似乎没有按预期运行(未在12小时以上完成)。我忍不住觉得自己在想什么...
wcdata <- wcdata %>%
group_by(betId) %>%
mutate(markets=n_distinct(MarketCode),
states=n_distinct(State1),
legs=n(),
eventTypes=n_distinct(eventType)) %>%
ungroup()
在某些情况下
wcdata
数据帧约为1300万x 20 betId
MarketCode
是一个因素,每个唯一的n_distinct
(通常更少)可能有100个级别,其中betId
最多为10。State1
是2个可能水平的因数eventType
是2个可能水平的因数betId
将有1到20 legs
之间,平均约为3。我是在做错什么,还是有另一种方法可以做我想做的事情(我认为从代码片段中可以明显看出我要实现的目标,如果我做错了,请纠正我)?