在编码R中的置信区间时,如何使用dplyr获得列的长度

时间:2017-12-12 10:59:45

标签: r dplyr confidence-interval sample-size

我的数据集可以参考here。在gist中,我有一个名为fit的列,我需要绘制平均值和置信区间。

我正在尝试使用dplyr函数为我的ggplot编码置信区间

data.melt$time = factor(data.melt$time, levels=paste("t", seq(0, 10), sep=""))

这是代码

summary_dat = data.melt$time  %>%
              group_by(resource, fertilizer, time) %>%
              summarise(mean_predict=mean(fitted),
                        sd_predict = sd(fitted),
                        n_predict = n(fitted)) %>%

  mutate(se = sd_predict / sqrt(n_predict),
         lower_ci = mean_predict - qt(1 - (0.05 / 2), n_predict - 1) * se_predict,
         upper_ci = mean_predict + qt(1 - (0.05 / 2), n_predict - 1) * se_predict)

但是,R不允许我将n_predict编码为n(拟合)。我也试过长度(合身)但没有运气。有什么想法吗?

1 个答案:

答案 0 :(得分:1)

n()中的便捷函数dplyr仅计算子集中的行数,而不是子集中其中一列的长度。它不需要参数。您想使用n_predict = n()n_predict = length(predict)