从多个页面抓取数据时如何处理异常?

时间:2019-04-29 08:55:45

标签: r exception web-scraping rvest

我有一个字符向量(x),它由多个URL组成。我正在使用rvest从每个URL抓取数据。发现矢量中的其中一个网址不正确,因为发生了error 404,而没有从其他页面中删除数据。如何运行程序,忽略不正确的url。

lapply(x ,
          function(url){

                         url %>% read_html() %>% 
                         html_nodes("") %>% 
                         html_text()

                             })

0 个答案:

没有答案