如何获得定量变量对定性变量的摘要描述统计信息?

时间:2019-03-23 10:29:21

标签: r

我有一个数据集,可以给我提供高速公路上的燃油经济性以及4缸和6缸汽车的其他变量。我尝试使用不起作用的group_by函数(要遵循的代码)

我已经安装并部署了dplyr软件包,但该软件包引发了错误

  

group_by(。,Cylinders)中的错误:找不到函数“ group_by”

Cars_filtered %>% group_by(Cylinders) %>% summarise(Min = min(Economy_highway,na.rm = TRUE),
                                                    Q1 = quantile(Economy_highway,probs = .25,na.rm = TRUE),
                                                    Median = median(Economy_highway, na.rm = TRUE),
                                                    Q3 = quantile(Economy_highway,probs = .75,na.rm = TRUE),
                                                    Max = max(Economy_highway,na.rm = TRUE),
                                                    Mean = mean(Economy_highway, na.rm = TRUE),
                                                    SD = sd(Economy_highway, na.rm = TRUE),
                                                    n = n(),
                                                    Missing = sum(is.na(price))

我想查看不同的4缸和6缸汽车的高速公路燃油经济性的简要描述统计数据。

还有其他解决方法吗?

1 个答案:

答案 0 :(得分:1)

为此,使用tapply就足够了。

使用mtcars数据集,假设您对按gear分组的MPG的摘要统计数据感兴趣,可以使用:

tapply(mtcars$mpg,mtcars$gear, summary)

如果您只想检索齿轮“ 3”和“ 4”的摘要统计信息,则可以使用添加

tapply(mtcars$mpg,mtcars$gear, summary)[c("3", "4")]

如果您要添加例如标准差或样本量作为默认汇总输出的值,您可以定义自己的汇总函数:

smmry <- function(x) c(summary(x), sd = sd(x), n = length(x))

tapply(mtcars$mpg,mtcars$gear, smmry)