Rvest无法Webscrape某些站点

时间:2018-07-17 21:37:04

标签: html r web-scraping rvest

尝试在R中创建一个应用程序,该应用程序从以下网站返回搜索数据:

https://www.gsaadvantage.gov/advantage/main/start_page.do

,然后执行必要的数据分析。我使用的是“ rvest”软件包,几乎无法使用该网站的格式。例如,与以下方法类似的方法在其他网站上也可以使用,但是与此网站有关的某些问题引起了问题:

library('rvest')
url <-"https://www.gsaadvantage.gov/advantage/s/search.do?s=0&c=100&q=0:2mouse+pad&searchType=1&p=1"

data <- read_html(url) %>%
    html_nodes('.arial strong') %>%
    html_text()

是不是我们做错了什么,并且在GSA网站上有更好的软件包可以使用。谢谢!

0 个答案:

没有答案