Rvest无法找到由CSS选择器指定的节点,我该如何解决?

时间:2019-09-01 18:18:11

标签: r web-scraping rvest

我正在从该网站上抓取数据,由于某种原因,即使我使用SelectorGadget返回的确切节点,也无法获得卖方的名称。但是,我设法通过Rvest获得了所有其他数据。

我设法用RSelenium刮擦了卖家的名字,但这花了太多时间。无论如何,这是我要抓取的页面的链接:

https://www.kijiji.ca/v-fitness-personal-trainer/bedford/swimming-lessons/1421292946

这是我使用的代码

SellerName <-
  read_html("https://kijiji.ca/v-fitness-personal-trainer/bedford/swimming-lessons/1421292946") %>%
  html_nodes(".link-4200870613") %>%
  html_text()

1 个答案:

答案 0 :(得分:1)

您可以从退货单中轻松地对卖方名称进行正则表达式,因为它包含在脚本标签中(大概在浏览器能够运行javascript时才从此处加载,而rvest则不能。)

LIST

正则表达式:

enter image description here