无法到达CSS节点

时间:2018-06-23 00:59:37

标签: css r rvest

在此页面上: http://www.beta.inegi.org.mx/app/buscador/default.html?q=e15a61a

我正在尝试检索以下网址: http://www.beta.inegi.org.mx/app/biblioteca/ficha.html?upc=702825720599

我试图通过css选择器和xpath(在Web开发人员标签中右键单击复制)来访问它,但是,我只得到了{xml_nodeset(0)]

library(rvest)
url <- "http://www.beta.inegi.org.mx/app/buscador/default.html?q=e15a62b"
url %>% html_node("#snippet_row-tag_a_0") 
url %>% html_node(xpath='//*[@id="snippet_row-tag_a_0"]')

1 个答案:

答案 0 :(得分:2)

您要抓取的项目均使用JavaScript呈现,您可以改用隐藏的API:

尝试以下网址:
http://www.beta.inegi.org.mx/app/api/buscador/busquedaTodos/E15A61A_A/RANKING/es

这将返回一个JSON字符串,您可以将其解析为R中的列表并提取所需的信息。