用于统计建模的SQL命令

时间:2014-11-25 04:13:40

标签: mysql sql r statistics

我将一组曲棍球统计数据导入到R中的数据框中。我无法为我想要的数据集找到正确的查询。

所有记录都保存在1个名为skaters的表中

Name     Team     Opp     G
AAAAA     PHI     BOS     2
BBBBB     NYR     OTT     7
AAAAA     PHI     BOS     9
DDDDD     BOS     PHI     3
EEEEE     BOS     PHI     1
FFFFF     PHI     BOS     2
GGGGG     OTT     NYR     3

我想找到一种方法来获得每队G的总和。想到你使用像

这样的查询

SELECT DISTINCT(Team), SUM(G) FROM skaters但是这并没有给我我所期待的。

然后我找到了GROUP BY函数,它找到了正确的数据。然后我想再次提高赌注。

我想执行一个查询,它将执行我正在寻找的总和,但对于主队和客队都要进行比较。

4 个答案:

答案 0 :(得分:2)

希望这是你想要的。

SELECT Team, SUM(G) 'Sum' FROM skaters group by Team

答案 1 :(得分:1)

library(data.table)
setDT(df)  # convert data frame to data table
df[,list(sum_G = sum(G)), by=Team]  
#    Team sum_G
# 1:  PHI    13
# 2:  NYR    10
# 3:  BOS     4

# Or 

library(dplyr)
df %>% group_by(Team) %>% summarise(sum_G = sum(G))

答案 2 :(得分:0)

由于您声明数据框中包含统计信息:

aggregate(skaters$G, list(skaters$Team), sum)

答案 3 :(得分:0)

    Select Team ,Sum(G) as Total from skaters Group by Team