刮掉这个网页的最佳方法是什么? fromJSON似乎没有用

时间:2015-12-07 07:28:45

标签: json r web-scraping jsonlite

我很高兴使用getURL和fromJSON(R中的jsonlite包)抓取这个移动应用程序网站的部分内容。例如,我一直在使用这段代码而且非常直接:

CardURL = getURL("http://m.racingpost.com/#cards-horse/horse_id=901690& race_id=639116&r_date=2015-12-07")
CardDATA = fromJSON(CardURL)
CardDATA[["tab-card"]][["runners"]]

然而,当我到达网页的这个特定部分时,它的工作方式与其他部分不同:

http://m.racingpost.com/#cards-horse/horse_id=901690&race_id=639116&r_date=2015-12-07

它似乎以“你的浏览器未优化”之类的文本返回,而不是返回我想要删除的实际文本。像这样刮取数据的最佳方法是什么?

感谢

0 个答案:

没有答案