我尝试使用this获取数据。
使用getUrl()和readHTMLTable()方法,可以在R中完美地获取2015/2016季节的数据(性能得分,总得分等)。
但是,当我使用url for 2012/2013尝试相同的代码时,2015/2016的数据正在被提取。我找出原因但无法解决问题。如果您访问此链接,您将看到加载的内容是针对2015/2016季节,然后,在刷新后,将加载2012/2013的数据。这种延迟导致错误地将数据提取到R中。
由于url包含片段标识符,因此会发生此延迟。我从在线资源中发现,片段不会在HTTP请求消息中发送。片段标识符仅供浏览器使用 - 它不会影响从服务器返回的资源。
在R中有什么方法可以根据提到的片段标识符获取数据吗?
答案 0 :(得分:1)
由于您似乎知道自己在使用R
做了什么(如果您需要更多数据,请注释),我会查看使用您的本地broswer的RSelenium
(使用firefox!)来检索数据。因此,您将获得post jss / ajax等呈现的HTML。有很多东西需要学习!
https://cran.r-project.org/web/packages/RSelenium/vignettes/RSelenium-basics.html