如何使用summary和group_by?

时间:2019-04-11 07:48:53

标签: r dplyr

数据集中:提示:使用函数filter,group_by,summary和管道%>%分别计算每个年龄组女性的收缩压的平均值和标准偏差。 在摘要中,将收缩压的平均和标准偏差(BPSysAve)保存为平均值和标准偏差。

我的代码:

library(dplyr)
library(NHANES)
data(NHANES)

任务:使用group_bysummarize

结束一行
NHANES %>%
 filter(Gender == "female") %>%
 group_by(AgeDecade) %>%
 summarize(average = mean(BPSysAve, na.rm = TRUE),
           standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
 na.omit()

不了解我的代码有什么问题。数据营不接受。

1 个答案:

答案 0 :(得分:0)

像这样?

 NHANES %>%
  filter(Gender == "female") %>%
  group_by(AgeDecade) %>%
  summarize(average = mean(BPSysAve, na.rm = TRUE),
       standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
   .[complete.cases(.),]

问题是最终输出中只有3个变量。代码中的最后一行可以替换为“ filter(!is.na(AgeDecade))”,因为否则您不太可能拥有NA。