当表更改但URL没有时,在R中进行Web抓取

时间:2017-09-16 00:10:34

标签: r web-scraping

我正在努力将NCAA体操乐谱从roadtonationals.com刮到R.我过去已经能够使用readLines(),但网站最近已更新,我的旧代码不再有效。

特别是,当我查看排名(roadtonationals.com/results/standings/)时,我可以使用下拉菜单更改季节,年份,星期和团队/个人。我可以使用右侧的选项卡在四个事件之间进行更改。但是,即使表更改,URL仍保持不变。我对网站编码知之甚少,所以我甚至不知道这种类型的表被称为什么或从哪里开始。

从技术上讲,我可以复制和粘贴,但最终,我想要像roadtonationals.com/results/schedule/meet/20409这样的页面,就像我以前能够获得的每个单独得分一样。选择团队或事件而不更改URL。

我发现了这个问题:

Using R to scrape tables when URL does not change

似乎问我的事情是一样的。

然而,当我尝试

library(httr)

standings <- POST(url = "https://roadtonationals.com/results/standings/season")

我收到一条消息,上面写着“不可接受。”和“在此服务器上找不到所请求资源/结果/排名/季节的适当表示。”

0 个答案:

没有答案