使用dplyr获取计数

时间:2016-04-17 22:42:40

标签: r statistics dplyr

我希望能够在对它们进行分组后获得计数,标准偏差和某些变量的平均值。我能够得到平均值和标准,但得到计数给了我一个错误。这是我的以下代码:

NYC_Trees %>%
    group_by(Condition) %>%
    dplyr::summarise(mean = round(mean(Compensatory.Value), 2),
                     sd   = round(sd(Compensatory.Value), 2), 
                     count(NYC_Trees,Condition, wt = Compensatory.Value))

我收到错误:无法处理。

我想要输出如:

Condition    Native     N     Mean    Std

我做错了什么?

1 个答案:

答案 0 :(得分:1)

count(NYC_Trees,Condition, wt = Compensatory.Value)应与NYC_Trees %>% group_by(Condition) %>% summarise(n = sum(Compensatory.Value)相同。这显然会返回一个向量,因此summarise函数无法处理它。

所以你可以在n = sum(Compensatory.Value)

中加上summarise
NYC_Trees %>%
    group_by(Condition) %>%
    dplyr::summarise(mean = round(mean(Compensatory.Value), 2),
                     sd   = round(sd(Compensatory.Value), 2), 
                     n = sum(Compensatory.Value))

这是你想要做的吗?如果您只想要每组中的值数,则可以使用n = n()代替:

NYC_Trees %>%
    group_by(Condition) %>%
    dplyr::summarise(mean = round(mean(Compensatory.Value), 2),
                     sd   = round(sd(Compensatory.Value), 2), 
                     n = n())