需要一些建议才能开始使用回溯表。(MLB的棒球数据)

时间:2018-02-28 14:37:09

标签: mysql r windows bash data-science

我试图了解如何使用回溯表中的事件文件(通过播放数据播放)。我还想了解在跳过Chadwick工具之前如何使用retrosheet提供的DiamondWare工具。我跟随http://www.retrosheet.org/stepex.txt,但我认为这些信息已经过时(也许我错了),因为它使用" 1982al.zip"我在网页上找不到这种数据格式。

我还看到一些工具已经用Python和R开发了。我试着用R-package" retrosheet" (https://github.com/rmscriven/retrosheet)但是效果不好(也许是因为我的无知)。

我想要的是学习,所以我的问题是:任何人都可以推荐我一个"教程"或者指导"或者给我一些建议来开始使用retrosheet?开始使用retrosheet的最快捷方式是什么?

非常感谢您的进步。

塞尔吉奥。

1 个答案:

答案 0 :(得分:2)

The retrosheet package博客上的

Retrosheet Package, Part 2Exploring Baseball Data with R帖子引导读者了解retrosheet 包的几个用例。

前者关注堪萨斯城皇家队的2014-2015赛程,后者探讨了迈克特劳特2013年全垒打。

<强>更新

看起来getRetrosheet()不再被维护了。如果您想使用它,我建议不要从CRAN安装它。相反,您应该使用拉取请求版本 - keberwein/retrosheet - 它修复了# assuming you've already installed retrosheet # remove unmaintained version of retrosheet remove.packages( pkgs = "retrosheet" ) # install devtools to enable you to download packages from GitHub install.packages( pkgs = "devtools" ) library( devtools ) # install PR request version of retrosheet install_github( repo = "keberwein/retrosheet" ) # load retrosheet library( retrosheet ) # download 2017 MLB rosters roster.2017 <- getRetrosheet( type = "roster", year = 2017) # check the dimension of each data frame in roster.2017 lapply( X = roster.2017, FUN = dim ) # $ARI # [1] 45 7 # # $ATL # [1] 49 7 # # $BAL # [1] 50 7 # # $BOS # [1] 49 7 # # $CHA # [1] 51 7 # # $CHN # [1] 47 7 # # $CIN # [1] 47 7 # # $CLE # [1] 41 7 # # $COL # [1] 41 7 # # $DET # [1] 49 7 # # $HOU # [1] 46 7 # # $KCA # [1] 49 7 # # $LAN # [1] 52 7 # # $MIA # [1] 43 7 # # $MIL # [1] 50 7 # # $MIN # [1] 52 7 # # $NYA # [1] 51 7 # # $NYN # [1] 52 7 # # $OAK # [1] 54 7 # # $PHI # [1] 51 7 # # $PIT # [1] 47 7 # # $SDN # [1] 52 7 # # $SEA # [1] 61 7 # # $SFN # [1] 49 7 # # $SLN # [1] 48 7 # # $TBA # [1] 53 7 # # $TEX # [1] 51 7 # # $TOR # [1] 60 7 # # $WAS # [1] 49 7 # end of script # 函数。

为此,请遵循以下代码:

{{1}}