Question

数据集中：提示：使用函数filter，group_by，summary和管道％>％分别计算每个年龄组女性的收缩压的平均值和标准偏差。在摘要中，将收缩压的平均和标准偏差（BPSysAve）保存为平均值和标准偏差。

我的代码：

library(dplyr)
library(NHANES)
data(NHANES)

任务：使用group_by和summarize

结束一行

NHANES %>%
 filter(Gender == "female") %>%
 group_by(AgeDecade) %>%
 summarize(average = mean(BPSysAve, na.rm = TRUE),
           standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
 na.omit()

不了解我的代码有什么问题。数据营不接受。

Answer 1

像这样？

 NHANES %>%
  filter(Gender == "female") %>%
  group_by(AgeDecade) %>%
  summarize(average = mean(BPSysAve, na.rm = TRUE),
       standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
   .[complete.cases(.),]

问题是最终输出中只有3个变量。代码中的最后一行可以替换为“ filter（！is.na（AgeDecade））”，因为否则您不太可能拥有NA。

如何使用summary和group_by？

1 个答案: