我试图找到R dplyr等效于SQL Server的窗口函数,它允许程序查找COUNT
,SUM
,MIN
,MAX
基于某些分组,但没有减少返回的行数。
在SQL Server中,它们将按以下示例所示编写:
SELECT
Account,
Item_Code,
Views,
COUNT( Views ) OVER (PARTITION BY Account, Item_Code),
SUM( Views ) OVER (PARTITION BY Account, Item_Code),
MIN( Views ) OVER (PARTITION BY Account, Item_Code),
MAX( Views ) OVER (PARTITION BY Account, Item_Code)
答案 0 :(得分:0)
在group_by %>% mutate
dplyr
中使用mutate_at
来完成此任务,因为您要汇总多个统计信息的相同列,您可以使用df
来简化此操作,(假设您的数据框名为df %>%
group_by(Account, Item_Code) %>%
mutate_at('Views', funs(cnt = sum(!is.na(.)), sum, min, max))
):
fgets