使用R

时间:2017-03-12 19:16:14

标签: xml web-scraping rcurl rvest

我正在尝试使用rcurl来抓取下一页的数据,但它似乎不起作用。有没有办法从这个页面中删除数据?

url = "http://www.gallop.co.za/#meeting#20170305#44"
fromJSON(url)

它返回错误:

Error in feed_push_parser(readBin(con, raw(), n), reset = TRUE) : 
  lexical error: invalid char in json text.
                                       <!DOCTYPE html> <html lang=en> 
                     (right here) ------^

如何正确抓取此页面?

感谢,

1 个答案:

答案 0 :(得分:0)

此网址链接到html文件,而不是json。您可能需要getURL包中的RCurl函数。您可以通过firefox的firebug分析Web数据。