我有一个数据集,该数据集按州列出了二手车。我想按每个州的百分比计算出坏车的前10个州
无效的代码是:
carDF2 = carDF %>% filter(!is.na(IsBadBuy)) %>% group_by(VNST) %>%
mutate(PBadBuy = round(IsBadBuy/sum(IsBadBuy), 3))
数据表:
答案 0 :(得分:0)
也许是这样?我已经使用了mtcars数据集。用您自己的变量替换。
您还要添加过滤器
mtcars
mt2 <- mtcars %>%
filter(!is.na(gear)) %>%
select(cyl, gear) %>% #select the columns you want
group_by(cyl) %>% # for you it is VSNT
count %>% #because it isn't an integer
ungroup %>% # so that values aren't 1
mutate(prop_n = n/sum(n))
mt2
这将为您提供比例。