数据集中:提示:使用函数filter,group_by,summary和管道%>%分别计算每个年龄组女性的收缩压的平均值和标准偏差。 在摘要中,将收缩压的平均和标准偏差(BPSysAve)保存为平均值和标准偏差。
我的代码:
library(dplyr)
library(NHANES)
data(NHANES)
任务:使用group_by
和summarize
NHANES %>%
filter(Gender == "female") %>%
group_by(AgeDecade) %>%
summarize(average = mean(BPSysAve, na.rm = TRUE),
standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
na.omit()
不了解我的代码有什么问题。数据营不接受。
答案 0 :(得分:0)
像这样?
NHANES %>%
filter(Gender == "female") %>%
group_by(AgeDecade) %>%
summarize(average = mean(BPSysAve, na.rm = TRUE),
standard_diviation = sd(BPSysAve, na.rm = TRUE)) %>%
.[complete.cases(.),]
问题是最终输出中只有3个变量。代码中的最后一行可以替换为“ filter(!is.na(AgeDecade))”,因为否则您不太可能拥有NA。