rvest错误-强制引入的NA(xpath和CSS)

时间:2019-03-05 21:21:26

标签: css xpath web-scraping rvest

我试图在较长时间内刮擦一个网站并收集各种衣物的每日价格。我已经按照RStudio博客上的教程进行操作,但是即使使用SelectorGadget,也无法在测试集中复制该想法。我已经尝试过以下代码仍然收到NA:

url<- "https://www.zara.com/us/en/authentic-jeans-p00840407.html?v1=9035594&v2=1204074"

    jeans <- url %>%
      read_html() %>%
      html_nodes(".description , .product-price span") %>%
      html_text() %>%
      as.numeric()

我也尝试使用xpath格式,但仍然没有运气:

jeans <- url %>%
  read_html() %>%
  html_nodes(xpath = '//*[contains(concat( " ", @class, " " ), concat( " ", "product-price", " " ))]') %>%
  html_text() %>%
  as.numeric()

我非常感谢您可能分享的任何见解-如果您传递了任何详细说明如何根据提取的数据随时间构建数据库或如何批处理RVest的资源,则将真的感谢您。 webscrape请求!

谢谢!

0 个答案:

没有答案