为dplyr中的每个函数保存na.rm = TRUE

时间:2017-12-11 10:15:03

标签: r dplyr na.rm

我正在使用dplyr汇总功能。我的数据包含NA,因此我需要为每个调用包含na.rm = TRUE。例如:

int alltips = driver.findElements(By.xpath("//ul[@id='Grid']/li")).size();

有没有办法只用一次写入参数na.rm = TRUE,而不是 在每一行?

2 个答案:

答案 0 :(得分:3)

您应该使用summarise_at,它允许您为提供的列计算多个函数并设置它们之间共享的参数:

df %>% group_by(group) %>% 
  summarise_at("value", 
               funs(mean = mean, sd = sd, min = min), 
               na.rm = TRUE)

答案 1 :(得分:1)

如果您计划仅将功能应用于一个列,则可以使用filter(!is.na())来过滤掉此变量的任何NA值(即NA。变量不会影响过程。)

group <- rep(c('a', 'b'), 3)
value <- c(1:4, NA, NA)
df = data.frame(group, value)

library(dplyr)

group_by(df, group) %>% 
  filter(!is.na(value)) %>%
  summarise(mean = mean(value),
            sd = sd(value),
            min = min(value))

# # A tibble: 2 x 4
#    group  mean       sd   min
#   <fctr> <dbl>    <dbl> <dbl>
# 1      a     2 1.414214     1
# 2      b     3 1.414214     2