我使用的是Lahman 2018数据库的csv版本:http://www.seanlahman.com/baseball-archive/statistics/。
在R中,我想确定在第95场比赛中,所有Mets新秀在新秀赛季中击中了多少个额外基准命中率。我想找出在第95场比赛中哪个Met新秀命中率最高的出场率。 / p>
我一直在尝试dplyr功能,包括选择,过滤和汇总。
我不确定的主要问题是如何在第一赛季的前95场比赛中只获得每位大都会球员的双打,三重和本垒打。
此代码显示了我所做的更多工作以及我认为可以解决问题的方式-为此,我正在寻求技巧。
library(dplyr)
df %>% filter(teamID=='NYN') %>%
select(c(playerID, yearID, G, 2B, 3B, HR)) %>%
group_by(playerID, yearID) %>%
summarise(xbh = sum(2B) + sum(3B)+ sum(HR)) %>%
arrange(desc(xbh))
这是我希望输出显示的方式:
Player Season 2B 3B HR XBH
x 1975 10 2 8 20
y 1980 5 5 5 15
z 2000 9 0 4 13
以此类推。
我希望XBH降序排列。