错误检查r中的循环与Web抓取

时间:2015-01-23 04:33:29

标签: r try-catch

我有一个网页列表,我想查看该网站的某个部分是否存在。

library(rvest)

links
[1] "http://www.stevel.com/?xid=2679644&dd=2015-01-22"
[2] "http://www.stevel.com/?xid=2679644&dd=2015-01-21"
[3] "http://www.stevel.com/?xid=2679644&dd=2015-01-20"
[4] "http://www.stevel.com/?xid=2679644&dd=2015-01-19"
[5] "http://www.stevel.com/?xid=2679644&dd=2015-01-18"

我已经将我的代码移动了很多,似乎无法正常工作。

newlist <- c()
for (i in 1:length(links)) {
  separate <- html(links[i])
  try(separate %>%
        html_nodes('div span') %>%
        .[[13]], silent=TRUE)
  newlist <- rbind(links[i],newlist)
}

所需的输出将是有效的链接(不会产生错误)。

[1] "http://www.stevel.com/?xid=2679644&dd=2015-01-22"
[2] "http://www.stevel.com/?xid=2679644&dd=2015-01-20"

所以,基本上我有一个链接列表。我在尝试合并&#39;尝试&#39;在R.我想循环遍历链接并尝试每个链接以查看它的某个方面是否存在 - 这是我放在try子句中的部分。如果存在,则将该网页放入“新列表”中。如果它不存在则将其遗漏。

任何帮助指出我正确方向的人都将不胜感激。

0 个答案:

没有答案