如何使用Rvest抓取数据

时间:2019-06-17 17:51:31

标签: r web-scraping rvest

我正在尝试从此网站https://www.uchealth.com/our-locations/#hospitals上获取地址

我尝试过:

  html_nodes(xpath = "//*[@id='uch_location_results']/div[1]/div/div[2]/address") %>%
  html_text()

关于我在做什么错的任何建议?

1 个答案:

答案 0 :(得分:1)

如果使用“网络”标签,您将找到地址的源网址

library(rvest)

r <- read_html('https://www.uchealth.com/wp-content/themes/uchealth-2016-interim/ajax/location_search.php?region=hospitals') %>% 
  html_nodes('address') %>% 
  html_text()

可通过以下CSS选择器查看医院名称:

h3