我将一组曲棍球统计数据导入到R中的数据框中。我无法为我想要的数据集找到正确的查询。
所有记录都保存在1个名为skaters的表中
Name Team Opp G
AAAAA PHI BOS 2
BBBBB NYR OTT 7
AAAAA PHI BOS 9
DDDDD BOS PHI 3
EEEEE BOS PHI 1
FFFFF PHI BOS 2
GGGGG OTT NYR 3
我想找到一种方法来获得每队G的总和。想到你使用像
这样的查询 SELECT DISTINCT(Team), SUM(G) FROM skaters
但是这并没有给我我所期待的。
然后我找到了GROUP BY函数,它找到了正确的数据。然后我想再次提高赌注。
我想执行一个查询,它将执行我正在寻找的总和,但对于主队和客队都要进行比较。
答案 0 :(得分:2)
希望这是你想要的。
SELECT Team, SUM(G) 'Sum' FROM skaters group by Team
答案 1 :(得分:1)
library(data.table)
setDT(df) # convert data frame to data table
df[,list(sum_G = sum(G)), by=Team]
# Team sum_G
# 1: PHI 13
# 2: NYR 10
# 3: BOS 4
# Or
library(dplyr)
df %>% group_by(Team) %>% summarise(sum_G = sum(G))
答案 2 :(得分:0)
由于您声明数据框中包含统计信息:
aggregate(skaters$G, list(skaters$Team), sum)
答案 3 :(得分:0)
Select Team ,Sum(G) as Total from skaters Group by Team