在管道中使用dplyr时,如何更改数据框中的变量?
例如,我想读取一个文件并将NA
的值替换为零,然后对日期列进行排序?
# read file
df <- readr("myfile.txt") %>% janitor::clean_names()
# sort by data
df$date <- lubridate::ymd(df$date)
df <- dplyr::arrange(df, date)
# change NA to zero
df$cost[is.na(df$cost)] <- 0
在读取文件时如何将它们移到上方的管道工作流程中?
答案 0 :(得分:2)
使用dplyr
,您可以执行以下操作:
df <- readr("myfile.txt") %>%
janitor::clean_names() %>%
mutate(date = lubridate::ymd(date),
cost = ifelse(is.na(cost), 0, cost)) %>%
arrange(date)