为什么dplyr :: tally读取函数中的变量?

时间:2015-11-07 19:28:54

标签: r dplyr

dplyr :: tally比dplyr :: count更快。为什么不能在函数中读取alpha变量?

对于此示例的示例x,请说:

tbl_df(x)
Source: local data frame [128,438 x 17] ...

StateVoterID RegistrationNumber LastName FirstName ...

uPID <- sort(unique(x$PrecinctID))  
findP <- function(y) {  
x %>%  
summarise(  
Count = sum(PrecinctID == y),  
Good = sum(AVReturnStatus == "Good" & PrecinctID == y),  
Late = sum(AVReturnChallenge == "Too Late" & PrecinctID == y))  
}  

u1 <- t(sapply(uPID,findP))  
u1 <- cbind(uPID,u1)  


head(u1)  
     uPID Count Good Late  
[1,] 101  917   476  4   
[2,] 102  630   367  8   
[3,] 103  687   482  2   
[4,] 104  439   312  1   
[5,] 105  414   252  0   
[6,] 106  778   422  2   

[自我回答:]

我能够解决自己的问题。 Tally只接受tbl数据。因此,无论您使用计数还是汇总,它都可以通过dplyr管道(%&gt;%)或&#34;然后&#34;运营商。一旦这样做,可以编排嵌入查询的相当复杂的字段。鉴于x是大型选民数据库:

{{1}}

0 个答案:

没有答案