dplyr :: tally比dplyr :: count更快。为什么不能在函数中读取alpha变量?
对于此示例的示例x,请说:
tbl_df(x)
Source: local data frame [128,438 x 17] ...
StateVoterID RegistrationNumber LastName FirstName ...
uPID <- sort(unique(x$PrecinctID))
findP <- function(y) {
x %>%
summarise(
Count = sum(PrecinctID == y),
Good = sum(AVReturnStatus == "Good" & PrecinctID == y),
Late = sum(AVReturnChallenge == "Too Late" & PrecinctID == y))
}
u1 <- t(sapply(uPID,findP))
u1 <- cbind(uPID,u1)
head(u1)
uPID Count Good Late
[1,] 101 917 476 4
[2,] 102 630 367 8
[3,] 103 687 482 2
[4,] 104 439 312 1
[5,] 105 414 252 0
[6,] 106 778 422 2
[自我回答:]
我能够解决自己的问题。 Tally只接受tbl数据。因此,无论您使用计数还是汇总,它都可以通过dplyr管道(%&gt;%)或&#34;然后&#34;运营商。一旦这样做,可以编排嵌入查询的相当复杂的字段。鉴于x是大型选民数据库:
{{1}}