我有一个数据集,可以给我提供高速公路上的燃油经济性以及4缸和6缸汽车的其他变量。我尝试使用不起作用的group_by函数(要遵循的代码)
我已经安装并部署了dplyr软件包,但该软件包引发了错误
group_by(。,Cylinders)中的错误:找不到函数“ group_by”
Cars_filtered %>% group_by(Cylinders) %>% summarise(Min = min(Economy_highway,na.rm = TRUE),
Q1 = quantile(Economy_highway,probs = .25,na.rm = TRUE),
Median = median(Economy_highway, na.rm = TRUE),
Q3 = quantile(Economy_highway,probs = .75,na.rm = TRUE),
Max = max(Economy_highway,na.rm = TRUE),
Mean = mean(Economy_highway, na.rm = TRUE),
SD = sd(Economy_highway, na.rm = TRUE),
n = n(),
Missing = sum(is.na(price))
我想查看不同的4缸和6缸汽车的高速公路燃油经济性的简要描述统计数据。
还有其他解决方法吗?
答案 0 :(得分:1)
为此,使用tapply
就足够了。
使用mtcars
数据集,假设您对按gear
分组的MPG的摘要统计数据感兴趣,可以使用:
tapply(mtcars$mpg,mtcars$gear, summary)
如果您只想检索齿轮“ 3”和“ 4”的摘要统计信息,则可以使用添加
tapply(mtcars$mpg,mtcars$gear, summary)[c("3", "4")]
如果您要添加例如标准差或样本量作为默认汇总输出的值,您可以定义自己的汇总函数:
smmry <- function(x) c(summary(x), sd = sd(x), n = length(x))
tapply(mtcars$mpg,mtcars$gear, smmry)