R中的SQL类型窗口函数(最好是dplyr)

时间:2018-03-18 00:28:58

标签: r dplyr

我试图找到R dplyr等效于SQL Server的窗口函数,它允许程序查找COUNTSUMMINMAX基于某些分组,但没有减少返回的行数。

在SQL Server中,它们将按以下示例所示编写:

SELECT
    Account,
     Item_Code,
     Views,
     COUNT( Views ) OVER (PARTITION BY Account, Item_Code),
     SUM( Views ) OVER (PARTITION BY Account, Item_Code),
     MIN( Views ) OVER (PARTITION BY Account, Item_Code),
     MAX( Views ) OVER (PARTITION BY Account, Item_Code)

1 个答案:

答案 0 :(得分:0)

group_by %>% mutate dplyr中使用mutate_at来完成此任务,因为您要汇总多个统计信息的相同列,您可以使用df来简化此操作,(假设您的数据框名为df %>% group_by(Account, Item_Code) %>% mutate_at('Views', funs(cnt = sum(!is.na(.)), sum, min, max)) ):

fgets