在dplyr汇总中混合行和列操作

时间:2017-12-08 22:40:50

标签: r function dplyr summarization

以下代码将两个变量z1z2相乘,然后在z0定义的组内对它们求和。

在求和中乘法和sum()是否有任何合理自然的方法?这里*sum()旨在表示对列操作结果应用行操作的任意函数,或对行操作结果的列操作,或基于各种加权汇总统计信息。例如,调查模型权重,以产生标量摘要。

z0 <- as.factor(c(1, 1, 2, 2))
z1 <- z2 <- 1:4
zz <- tibble(z0, z1, z2)
zz %>% group_by(z0) %>% 
    mutate(z3 = z1 * z2) %>% 
    summarise(out = sum(z3))

在我看来,尽管摘要通常最好被认为是属于组内部的一组内的操作,但有时候摘要更自然地被认为是二维数组,如组均值的比率,或第二个回归的第一个变量的分组R^2summarise()可以执行此类摘要吗?

0 个答案:

没有答案