我有一个使用fangraphs.com的大量数据的电子表格。以下是我正在使用的其中一个数据集的示例:
这是另一个例子:
因此,在我的电子表格中,我有一个标签,其中包含您选择"导出数据"在那个网站上。目前,当我想要更新数据时,我需要访问该网站并手动导出每个电子表格并将其粘贴到我的主页的标签中。
如何使用这些可导出工作表中的数据自动更新主工作表中的两个选项卡?一位朋友提到我可以使用R,所以我已将其下载,但我不确定从哪里开始教我自己如何做到这一点。
提前致谢,如果您需要更多详情,请与我们联系!
答案 0 :(得分:0)
您可能需要为每个团队下载团队,以确保您不会错过表格中的某些行: 例如Angel(=队1)
library(XML)
x=readHTMLTable(doc = "http://www.fangraphs.com/leaders.aspx?pos=p&stats=bat&lg=all&qual=0&type=0&season=2014&month=0&season1=2013&ind=0&team=1&rost=0&age=0&filter=&players=0")
x[[33]]
答案 1 :(得分:0)
您不必学习全新的语言(在这种情况下为R)才能完成工作。
基本上你要编写浏览器自动化脚本(点击,等待,获取数据)或"报废"网页。
您可以使用您已知的语言编写浏览器自动化脚本,请查看https://code.google.com/p/selenium-vba
这个问题也提供了一些提示:How to download the contents of a paginated Jquery/JS table?