我有按日期和时间间隔列出的整数计数观察数据框。我想使用dplyr软件包按日期查找这些观察结果的中位数。我已经正确格式化了日期列,并使用了group_by,如下所示:
data.bydate <- group_by(data.raw, date)
当我使用summarize()来查找每个日期组的中位数时,我得到的都是一堆零。数据中有NA,所以我用na.rm = TRUE剥离它们。
data.median <- summarise(data.bydate, median = median(count, na.rm = TRUE)
我应该采取另一种方式吗?
答案 0 :(得分:3)
你可以做点什么,
data.raw %>% group_by(date) %>% summarise(median = median(count, na.rm = TRUE))
答案 1 :(得分:0)
每个组可能有太多的零值。尝试识别每个组中唯一值的数量,以检查这些组中是否有太多零。以下代码可以帮助查看每个组中可用于计数变量的唯一值的数量和总值。
摘要(data.bydate,unique_code = n_distinct(count),total_count = n(count))