我正在努力将NCAA体操乐谱从roadtonationals.com刮到R.我过去已经能够使用readLines(),但网站最近已更新,我的旧代码不再有效。
特别是,当我查看排名(roadtonationals.com/results/standings/)时,我可以使用下拉菜单更改季节,年份,星期和团队/个人。我可以使用右侧的选项卡在四个事件之间进行更改。但是,即使表更改,URL仍保持不变。我对网站编码知之甚少,所以我甚至不知道这种类型的表被称为什么或从哪里开始。
从技术上讲,我可以复制和粘贴,但最终,我想要像roadtonationals.com/results/schedule/meet/20409这样的页面,就像我以前能够获得的每个单独得分一样。选择团队或事件而不更改URL。
我发现了这个问题:
Using R to scrape tables when URL does not change
似乎问我的事情是一样的。
然而,当我尝试
时library(httr)
standings <- POST(url = "https://roadtonationals.com/results/standings/season")
我收到一条消息,上面写着“不可接受。”和“在此服务器上找不到所请求资源/结果/排名/季节的适当表示。”