如何在保留NA的同时折叠数据框中的重复行?

时间:2017-05-11 21:03:43

标签: r row

我有一个如下所示的数据框:

Community, Sex, Total Pop, Age, Median
Kodiak,F,NA,NA,3
Kodiak,F,4,Na,NA
Kodiak,F,NA,5,NA
Teru,F,NA,0,NA
Teru,F,0,NA,NA

我想使用公共社区值名称折叠所有行。但是,我还想保留这些NAs(我已经做了一段时间了,它使NAs成为0,这是令人困惑的,因为0有价值 - 数据是人口普查数据)。我的实际数据框有数千行。

我试过了:

library(data.table)
fcensus7 <- fcensus6 %>%
group_by(Community) %>%
summarise_each(funs(sum(., na.rm = TRUE)))

但最终得到这个错误(之前有效,但也让我的所有NA都变为零):

  

summarise_impl(.data,dots)中的错误:       无效&#39;类型&#39;论证的(字符)

我对R.很新。谢谢!

1 个答案:

答案 0 :(得分:0)

看起来你有&#34; Na&#34;而不是&#34; NA&#34;为你的一个价值观。您可以尝试将na = c("", "NA", "Na")添加到read_csv函数调用中。