需要一些有关R如何处理这种情况的提示

时间:2019-07-18 22:43:54

标签: r dplyr

我使用的是Lahman 2018数据库的csv版本:http://www.seanlahman.com/baseball-archive/statistics/

在R中,我想确定在第95场比赛中,所有Mets新秀在新秀赛季中击中了多少个额外基准命中率。我想找出在第95场比赛中哪个Met新秀命中率最高的出场率。 / p>

我一直在尝试dplyr功能,包括选择,过滤和汇总。

我不确定的主要问题是如何在第一赛季的前95场比赛中只获得每位大都会球员的双打,三重和本垒打。

此代码显示了我所做的更多工作以及我认为可以解决问题的方式-为此,我正在寻求技巧。

  library(dplyr)
  df %>% filter(teamID=='NYN') %>% 
    select(c(playerID, yearID, G, 2B, 3B, HR)) %>% 
    group_by(playerID, yearID) %>%
    summarise(xbh = sum(2B) + sum(3B)+ sum(HR)) %>%
    arrange(desc(xbh))

这是我希望输出显示的方式:

    Player  Season 2B  3B  HR  XBH
    x       1975   10   2   8   20
    y       1980   5    5   5   15
    z       2000   9    0   4   13

以此类推。

我希望XBH降序排列。

0 个答案:

没有答案